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流水 线 、 指 令 集 、 总 线 …… 阅 读本 书 ， 那 都 不 是 事 儿 | 

本 书 手 把 手 地 教 您 从 零 实现 一 个 具有 五 级 流水 线 、 兼 容 
MIPS32 体 系 结构 、 带 有 Wishbone 总 线 接口 的 处 理 器 ， 并 为 其 
移植 了 嵌入 式 操 作 系统 p C05-II， 打 造 属 于 您 自己 的 独 一 无 
二 的 计算 机 系统 。 
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内 容 简介 


本 书 使 用 Verilog HDL 设计 实现 了 一 款 兼 容 MIPS32 指 令 集 架构 的 
处 理 器 一 OpenMIPS。OpenMIPS 处 理 器 具有 两 个 版 本 ， 分 别 是 教学 
版 和 实践 版 。 教 学 版 的 主要 设计 思想 是 尽量 简单 ， 处 理 器 的 运行 情况 
比较 理想 化 ， 与 教科 书 相 似 ， 便 于 使 用 其 进行 教学 、 学 术 研 究 和 讨 
论 ， 也 有 助 于 学 生理 解 课堂 上 讲授 的 知识 。 实 践 版 的 设计 目标 是 能 完 
成 特定 功能 ， 发 挥 实际 作用 。 


全 书 分 为 三 篇 。 第 一 篇 是 理论 篇 ， 介 绍 了 指令 集 架 构 、Verilog 
HDL 的 相关 知识 。 第 二 篇 是 基础 篇 ， 采 用 增 量 模型 ， 实 现 了 教学 版 
OpenMIPS 处 理 器 。 首 先 实 现 了 仪 能 执行 一 条 指令 的 处 理 器 ， 从 这 个 最 
简单 的 情况 出 发 ， 通 过 依次 添加 ， 实 现 逻 辑 操作 指令 、 移 位 操作 指 
令 、 空 指令 、 移 动 操 作 指令 、 算 术 操 作 指令 、 转 移 指 令 、 加 载 存 储 指 
令 、 协 处 理 器 访问 指令 、 异 常 相关 指令 ， 最 终 实 现 了 教学 版 OpenMIPS 
处 理 器 。 第 三 篇 是 进 阶 篇 ， 通 过 为 教学 版 OpenMIPS 添 加 Wishbone 总 线 
接口 ， 从 而 实现 了 实践 版 OpenMIPS 处 理 器 ， 并 与 SDRAM 控 制 器 、 
GPIO 模 块 、Flash 控 制 器 、UART 控 制 器 、Wishbone 总 线 互联 矩阵 等 模 
块 组 成 一 个 小 型 SOPC， 然 后 下 载 到 FPGA 心 片 以 验证 实现 效果 ， 最 后 
为 实践 版 OpenMIPS 处 理 器 移植 了 衬 入 式 实时 操作 系统 LC/OS-II。 


本 书 适 合计 算 机 专业 的 学 生 、FPGA 开 发 人 员 、 处 理 器 设计 者 、 
窜 入 式 系 统 应 用 开发 工程 师 、MIPS 平 台 开 发 人 员 以 及 对 处 理 器 内 部 的 
实现 感 兴 趣 的 读者 阅读 ， 也 可 以 作为 高 等 院 校 计算 机 原理 、 计 算 机 体 
系 结构 等 课程 的 实践 参考 书 。 


未 经 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 之 部 分 或 全 部 内 容 。 
版 权 所 有 ， 侵 权 必 究 。 
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自己 动手 与 处 理 器 ? 

自己 动手 写 处 理 器 ! 

没 错 ， 您 手 上 拿 着 的 就 是 一 本 介绍 如 何 实现 处 理 器 的 书 ， 通 过 阅 
读本 书 ， 您 可 以 实现 世界 上 独一无二 、 独 属于 您 的 处 理 器 。 

吹牛 ? 

Mm, No, BUNS FT UA. 

ME? 

Se 那 就 请 您 阅读 本 书 。 


SFAR 


自 1971 年 世界 上 第 一 款 单 心 片 微 处 理 器 4004 诞 生 已 人 靖 40 多 年 ， 使 
用 “日 新 月 异 ” 来 形容 这 40 多 年 处 理 器 的 发 展 变 化 亦 不 为 过 ， 无 论 是 速 
度 、 集 成 度 ， 还 是 架构 等 许多 方面 都 有 了 前 人 难以 想象 的 变化 。 不 过 
可 惜 的 是 ， 处 理 器 设计 制造 一 直 都 是 高 科技 行业 ， 轻 易 无 法 涉足 。 大 
多 数 人 对 处 理 器 的 直观 印象 就 是 一 个 银白 色 的 小 心 片 ， 有 许多 管 脚 ， 
至 于 里 面 是 如 何 工作 的 ， 则 不 甚 了 解 ， 更 不 用 说 自己 制作 处 理 器 了 。 


冬运 的 是 ， 在 处 理 器 发 展 的 同时 ， 可 编程 逻辑 器 件 也 在 持续 发 
展 。 可 编程 逻辑 器 件 不 仅 是 技术 的 革新 ， 也 带 来 了 观念 的 革新 、 设 计 
流程 的 革新 。 如 今 通 过 编写 代码 可 以 在 可 编程 逻辑 器 件 上 实现 十 分 复 
杂 的 电路 设计 ， 比 如 处 理 器 。 于 是 ， 普 通 大 众 也 能 有 机 会 了 解 处 理 器 
内 部 的 实现 原理 ， 甚 至 参与 处 理 器 的 设计 、 研 发 。 


实际 上 ， 目 前 已 经 有 很 多 可 以 下 载 到 可 编程 逻辑 器 件 上 运行 的 处 
理 器 ， 这 些 处理 器 称 为 软 核 处 理 器 ， 比 如 : NiosII、OR1200、 
LEON3、 OpenSparc 等 ， 这 些 软 核 处 理 器 有 的 是 开源 的 ， 有 的 不 是 开 
源 的 。 笔 者 在 前 期 深入 阅读 了 几 款 开源 软 核 处 理 器 的 代码 ， 包 括 : 
OC8051、OR1200、LEON3。 其 中 ，OC8051 是 OpenCores 提 供 的 一 款 8 
位 两 级 流水 线 处 理 器 ,与 Intel 8051 兼 容 ， 是 CISC (Complex 
Instruction Set Computer) 类 型 ， 采 用 Verilog HDL 编 写 代码 。OR1200 
是 OpenCores 提 供 的 一 款 32 位 五 级 流水 线 处 理 器 ， 是 RISC (Reduced 
Instruction Set Computer) 类 型 ， 也 采用 Verilog HDL 编 写 代 码 。LEON3 
是 由 Gaisler Research 公 司 设计 发 布 的 一 款 32 位 七 级 流水 线 处 理 器 ， 也 
是 RISC 类 型 ， 但 采用 的 是 VHDL 编 写 代码 。 


通过 阅读 上 述 开源 软 核 处 理 器 的 代码 ， 一 方面 消除 了 笔者 对 处 理 
器 的 神秘 印象 ， 另 一 方面 也 激发 了 笔者 强烈 的 创作 冲动 ， 陆 游 曾 言 : 
纸 上 得 来 终 觉 浅 ， 绝 知 此 事 要 身 行 。 是 啊 ! 为 何不 自己 也 写 一 个 处 理 
器 ? 于 是 世间 又 多 了 一 款 开 产 处 理 器 OpenMIPS。OpenMIPS 是 具有 哈 
佛 结构 的 32 位 五 级 流水 线 标量 处 理 器 ， 兼 容 MIPS32 体 系 结构 ， 这 样 可 
以 使 用 现 有 的 MIPS 编 译 开发 环境 。 它 分 为 教学 版 和 实践 版 两 个 版 本 ， 
每 个 版 本 都 使 用 VHDL 和 Verilog HDL 两 种 语言 编写 。 


AB LA Verilog HDL 编写 的 版 本 为 例 ， 详 细 介 绍 了 OpenMIPS 从 无 
到 有 、 从 小 到 大 、 一 步 一 步 成 长 完善 的 过 程 。 


写作 目的 


。 撕 掉 处 理 器 贴 着 的 “高 大 上 ”标签 


处 理 器 一 贯 被 人 们 贴 上 “高 大 上 ” “高 科技 ”诸如 此 类 的 标签 ， 贴 
标签 的 原因 就 在 于 人 们 对 此 不 了 解 ， 越 不 了 解 ， 越 觉得 神秘 ， 越 觉得 
促 秘 ， 就 越 不 想 了 解 ， 如 此 ,，“ 高 大 上 ”的 标签 算是 贴 牢 了 。 本 书 的 目 
的 之 一 就 是 帮助 读者 改变 这 种 固有 的 偏见 ， 从 本 质 上 认识 处 理 器 ， 撕 
掉 这 些 标签 。 简 单 来 说 ， 处 理 器 的 作用 就 是 识别 0、1 编 码 ， 也 就 是 识 
别 指令 ， 据 此 进行 各 种 运算 和 数据 处 理 。 处 理 器 只 能 计算 小 学 数学 课 
堂上 讲授 的 四 则 运算 ， 再 加 上 一 些 并 不 复杂 的 与 、 或 、 非 等 逻辑 运 
算 ， 其 余 诸 如 平方 、 开 方 、 微 分 、 积 分 等 都 是 做 不 了 的 。 是 不 是 很 简 
单 ? 


。 对 现 有 处 理 器 相关 书籍 的 补充 


翻 看 现 有 的 处 理 器 相关 书籍 ， 会 有 两 个 体会 : 一 个 体会 是 大 多 数 
书籍 讲授 的 理论 部 分 太 多 ， 实 践 部 分 太 少 。 过 多 的 理论 、 过 少 的 实 
践 ， 会 使 得 读者 知 其 然 ， 不 知 其 所 以 然 ， 第 二 个 体会 是 有 少 部 分 书籍 
讲授 处 理 器 的 实现 ， 但 是 介绍 的 方式 不 太 易 懂 ， 读 者 需要 对 处 理 器 有 
一 定 了 解 之 后 才能 阅读 此 类 书籍 。 因 此 ， 笔 者 想 结合 OpenMIPS 介 绍 处 
理 器 实现 ， 本 书 完全 按照 OpenMIPS 的 实现 过 程 讲解 ， 从 零 起 步 ， 遇 到 
什么 问题 就 解决 什么 问题 ， 笔 者 认为 这 样 易于 理解 。 


。 抛砖引玉 


高 手 在 民间 ， 此 言 不 虚 ， 笔 者 写作 此 书 的 第 三 个 目的 就 是 抛 砖 引 
玉 ， 和 希望 有 更 多 人 士 能 够 参与 维护 和 改进 OpenMIPS， 为 其 添加 更 多 的 


功能 ， 或 者 改善 性 能 。 当 然 ， 也 希望 出 现 更 多 类 似 的 软 核 处 理 器 ， 这 
样 ， 大 家 可 以 相互 学 习 、 相 互 探讨 、 取 长 补 短 、 共 同 进步 。 


适合 谁 读 


适合 对 处 理 器 内 部 的 实现 有 着 强烈 好 奇 心 的 朋友 阅读 ， 通 过 本 书 
介绍 的 OpenMIPS 处 理 器 的 实现 过 程 ， 您 将 全 方位 地 了 解 32 位 RISC 处 
理 器 的 内 部 设计 。 


适合 不 满足 于 教科 书 的 同学 阅读 ， 本 书 可 以 作为 您 的 实践 参考 
书 ， 帮 助 您 理解 书本 上 抽象 的 概念 ， 同 时 培养 动手 能 力 。 


适合 正在 从 事 软 核 处 理 器 开发 、 设 计 的 朋友 阅读 ， 本 书 将 给 您 一 
些 经 验 、 一 些 好 的 方法 ， 帮 助 您 事半功倍 。 


适合 正在 从 事 钦 入 式 开发 的 朋友 阅读 ， 本 书 对 处 理 器 的 一 些 介 
绍 ， 将 有 助 于 机 入 式 开 发 。 


内 容 安排 


全 书 共 15 章 ， 分 为 三 篇 ， 第 一 篇 是 理论 篇 ， 包 含 第 1、2 章 ， 介 绍 
了 指令 集 架构 、Verilog HDL 的 相关 知识 。 第 二 篇 是 基础 篇 ， 包 含 第 3 
人 11 章 ， 采 用 增 量 模型 ， 实 现 了 教学 版 OpenMIPS 处 理 器 。 第 三 篇 是 进 
阶 篇 ， 包 含 第 12~15 章 ， 实 现 了 实践 版 OpenMIPS 处 理 器 ， 并 为 其 移植 
了 赂 入 式 实时 操作 系统 JC/OS-II。 每 章 的 主要 内 容 如 下 。 


。 第 一 篇 ”理论 篇 


第 1 章 给 出 了 计算 机 的 简单 组 成 模型 、 简 单 使 用 模型 ， 对 比 了 
RISC 与 CISC， 说 明了 指令 集 架 构 的 作用 ， 并 列举 了 目前 几 种 主要 的 指 
令 集 架构 ， 由 于 OpenMIPS 采 用 的 是 MIPS32 指 令 集 架构 ， 所 以 本 章 后 
半 部 分 重点 介绍 了 MIPS32 指 令 集 架构 。 


第 2 章 介 绍 了 FPGA、Verilog HDL 的 基础 知识 ，FPGA 是 可 编程 逻 
辑 器 件 的 一 种 ， 本 书 的 实践 版 OpenMIPS 处 理 器 就 将 在 FPGA 上 运行 。 


. 第 二 篇 ”基础 篇 


第 3 章 介 绍 了 教学 版 OpenMIPS 处 理 器 的 设计 蓝图 ， 包 括 设计 目 
标 、 处 理 器 接口 ， 以 及 最 终 完成 时 组 成 OpenMIPS 的 各 个 模块 的 作用 ， 
力图 使 读者 有 一 个 整体 认识 。 另 外 ， 本 章 还 详 述 了 OpenMIPS 处 理 器 的 
实现 方法 。 


第 4 章 实现 了 OpenMIPS 处 理 器 的 第 一 条 指令 ori， 之 所 以 选择 这 条 
指令 作为 我 们 实现 的 第 一 条 指令 ， 就 是 因为 它 足够 简单 ， 指 令 ori 用 来 
实现 逻辑 “或 运算， 通过 这 条 简单 指令 的 实现 ， 初 步 建 立 了 OpenMIPS 
的 五 级 流水 线 结构 ， 后 续 章节 实现 其 余 指令 的 时 候 ， 都 是 在 这 个 初步 
建立 的 流水 线 结构 基础 上 进行 扩充 的 。 本 章 还 建立 了 用 于 测试 的 小 型 
SOPC， 并 通过 ModelSim 仿 真 验 证 ori 指 令 、 五 级 流水 线 实现 的 正确 与 


AS 
Ho 


第 5 章 讨 论 并 解决 了 流水 线 数据 的 相关 问题 ， 然 后 修改 第 4 章 的 
OpenMIPS， 添 加 实现 了 MIPS32 指 令 集 架构 中 定义 的 逻辑 、 移 位 操作 


第 6 章 介 绍 添 加 实现 了 MIPS32 指 令 集 架构 中 定义 的 移动 操作 指 


第 7 章 介 绍 添 加 实现 了 MIPS32 指 令 集 架构 中 定义 的 算术 操作 指 


第 8 章 介绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 转移 指令 ， 
OpenMIPS 支 持 延 迟 转移 。 


第 9 章 介 绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 加 载 存 储 指 


第 10 章 介绍 添加 实现 了 MIPS32 指 令 集 架构 中 定义 的 协 处 理 器 
CP0， 以 及 协 处 理 器 访问 指令 。 


在 每 一 类 指令 的 实现 过 程 中 ， 都 是 先 介 绍 该 类 指令 的 格式 、 作 用 
和 用 法 ， 然 后 介绍 实现 思路 ， 接 着 通过 修改 代码 实现 该 类 指令 ， 最 
后 ， 编 写 测试 程序 ， 使 用 仿真 的 方式 验证 实现 的 正确 性 。 


。 第 三 篇 ” 进 阶 篇 


第 12 章 介绍 在 教学 版 OpenMIPS 处 理 器 的 基础 上 ， 通 过 添加 
Wishbone 总 线 接口 模块 ， 实 现 了 实践 版 OpenMIPS 处 理 器 。 


第 13 章 讲述 设计 实现 了 基于 实践 版 OpenMIPS 处 理 器 的 小 型 可 编程 
片上 系统 SOPC 的 整个 过 程 。 该 SOPC 包 括 GPIO、UARI 控 制 器 、Flash 
空 制 器 、SDRAM 控 制 器 等 模块 ， 这 些 模 块 都 具有 Wishbone 总 线 接 
口 ， 与 OpenMIPS 处 理 器 一 起 挂 接 在 Wishbone 总 绪 互 联 窃 阵 上 。 


第 14 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 实际 的 硬件 平台 上 ， 编 写 
测试 程序 ， 验 证 实践 版 OpenMIPS 处 理 器 实现 的 正确 性 。 


第 15 章 介绍 了 网 入 式 实时 操作 系统 JC/OS-IT， 并 将 其 移植 到 本 书 
设计 的 OpenMIPS 处 理 器 上 ， 进 一 步 验 证 了 实践 版 OpenMIPS 处 理 器 实 
现 的 正确 性 ， 也 为 OpenMIPS 处 理 器 发 挥 实际 作用 奠定 了 基础 。 


本 书 特色 


e 从 无 到 有 、 从 小 到 大 ， 介 绍 一 款 处 理 器 的 成 长 过 程 


在 本 书 之 前 已 有 介绍 软 核 处 理 器 实现 的 书籍 ， 这 些 书 在 介绍 实现 
方法 时 有 一 个 共同 点 : 一 次 考虑 所 有 的 指令 、 所 有 的 情况 ， 然 后 给 
代码 。 笔 者 认为 这 不 是 读者 易于 接受 的 一 种 方法 ， 而 且 这 也 可 能 不 是 
作者 实现 处 理 器 时 采用 的 方法 。 在 本 书 中 ， 笔 者 借鉴 了 软件 开发 中 的 
“ 增 量 模型 ”的 概念 ， 使 用 了 一 种 完全 不 同 的 实现 方法 : 先 考虑 最 简单 
的 情况 ， 给 出 代码 ， 然 后 考虑 稍微 多 一 点 的 情况 ， 修 改 、 补 充 代 码 ， 
随 着 考虑 情况 的 增多 ， 不 停 地 修改 、 补 充 代 码 ， 最 终 ， 实 现 需求 的 两 
个 版 本 。 


。 教学、 实践 兼顾 
OpenMIPS 处 理 器 分 为 教学 版 和 实践 版 两 个 版 本 。 


教学 版 的 主要 设想 是 尽量 简单 ， 比 如 : 在 一 个 时 钟 周期 内 可 以 取 
到 指令 ， 完 成 存储 、 加 载 数据 ， 这 样 处 理 器 的 运行 情况 (比如 : 流水 
线 的 运行 ) 就 比较 理想 化 ， 与 教科 书 相 似 ， 代 码 也 很 清晰 简单 ， 便 于 


使 用 其 进行 教学 、 学 术 研究 和 讨论 ， 也 有 助 于 读者 理解 教科 书 上 讲授 
的 计算 机 的 原理 、 计 算 机 体系 结构 等 知识 。 


实践 版 的 主要 设计 思想 是 使 OpenMIPS 成 为 一 个 实际 可 用 的 处 理 
器 ， 能 够 下 载 到 可 编程 逻辑 器 件 上 ， 运 行 实际 有 用 的 程序 。 为 此 ， 添 
加 了 Wishbone 总 线 接口 ， 这 样 就 能 方便 地 利用 各 种 已 有 的 SDRAM、 
Flash、GPIO、UART、LCD 等 模块 控制 器 ， 组 成 一 个 SOPC， 完 成 特 
定 功 能 ， 进 一 步 还 可 为 其 移植 操作 系统 。 


光盘 内 容 

本 书 附带 光盘 提供 了 OpenMIPS 的 所 有 源 代 码 ， 以 及 一 些 开发 工 
具 ， 详 情 如 下 。 

e Code 文 件 夹 

提供 了 本 书 每 一 章 涉 及 的 OpenMIPS 源 代码 、 测 试 程序 。 

e Tools 文 件 夹 


提供 了 GNU 工 具 链 的 安装 文件 ， 以 及 一 个 小 工具 Bin2Mem.exe， 
该 工具 用 来 将 二 进 制 数 文 件 转化 为 可 以 用 于 ModelSim 仿 真 的 格式 。 


e Doc 文 件 夹 


提供 了 本 书 使 用 的 一 些 IP 核 的 说 明 手 册 ， 包 括 UART 控 制 器 、 
SDRAM 控 制 器 、GPIO 模 块 等 。 还 提供 了 FPGA 开 发 平台 DE2 的 说 明 手 
册 。 


e DE2 文 件 夹 


提供 了 用 来 将 程序 写 入 DE2 上 Flash 世 片 的 工具 ， 在 第 14、15 章 会 
用 到 。 


致谢 


感谢 0C8051、OR1200、LEON3 的 开发 者 ， 正 是 你 们 的 辛苦 工 
作 、 无 私 奉献 ， 使 得 我 们 有 机 会 领略 、 学 习 这 些 优秀 的 作品 ， 向 你 们 
致敬 ! 


笔者 是 第 二 次 与 博文 视点 合作 ， 一 如 有 既往 的 敏捷 、 了 迅速、 干练 ， 
在 此 特别 感谢 孙 学 瑛 老师 ， 孙 老师 以 专业 的 眼光 审阅 了 全 书 ， 提 出 了 
许多 宝贵 意见 ， 为 本 书 的 顺利 出 版 耗费 了 不 少 心力 。 
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写作 体会 


在 实现 OpenMIPS 处 理 器 的 过 程 中 ， 笔 者 深刻 体会 到 “罗马 非 一 日 
建成 ”这 句 话 ， 外 表 看 起 来 巨大 、 庞 杂 的 罗马 ， 也 是 通过 人 们 一 步 一 
步 、 一 天 一 天 、 一 点 一 点 建 成 的 ， 处 理 器 也 是 如 此 ， 读 者 首先 不 要 被 
处 理 器 的 神秘 吓 到 ， 从 最 简单 的 地 方 入 手 ， 逐 步 增加 功能 、 完 善 设 
计 ， 一 行 代码 一 行 代码 地 书写 ， 不 仅 要 有 实现 处 理 器 的 远大 目标 ， 还 
要 确立 切实 可 操作 的 短期 目标 ， 比 如 本 周 实现 除法 指令 ， 下 周 实现 转 
移 指令 ， 诸 如 此 类 ， 等 有 一 天 你 突然 回头 ， 会 发 现 ， 原 来 已 经 走 了 那 
么 远 ， 实 现 了 那么 多 功能 。 李 白 有 诗 云 ; 两 岸 猿 声 啼 不 住 ， 轻 舟 已 过 
万 重山 。 当 是 此 意 。 


处 理 器 实现 了 ， 但 要 把 它 的 实现 过 程 明 白地 表达 出 来 ， 让 读者 理 
解 ， 则 又 是 一 件 难 事 。 笔 者 从 开始 写作 到 最 终 完 稿 的 这 一 过 程 中 ， 一 
直 承 受 着 巨大 的 胡 熬 ， 几 度 欲 放 弃 写 作 ， 所 和 的 是 最 终 坚 持 了 下 来 。 


最 后 ， 我 想 对 各 位 读者 说 : 


一 个 人 的 旅行 是 孤单 的 
一 个 人 的 冬季 是 寒冷 的 
但 是 

一 个 人 的 处 理 器 是 骄傲 的 
让 我 们 骄傲 一 次 
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第 1 章 ”处理 器 与 MIPS 


时 间 开 始 了 ! 
一 一 胡 风 :1949 
让 我 们 以 一 句 诗意 的 话 ， 开 始 本 书 的 阅读 。 


时 间 从 1971 年 11 月 15 日 开始 ， 那 一 天 ，Intel 发 布 了 世界 上 第 一 款 
单 蕊 片 微 处 理 器 4004。 


11 计算 机 的 简单 模型 


计算 机 很 复杂 ， 可 以 听 歌 、 看 电影 、 上 网 、 玩 游戏 ， 内 部 是 怎么 
工作 的 ， 这 个 问题 太 可 怕 了 ， 太 复杂 了 。 


计算 机 很 简单 ， 只 可 以 做 加 、 减 、 乘 、 除 、 逻 辑 、 移 位 、 转 移 、 
存储 、 加 载 等 几 类 的 操作 ， 太 简单 了 。 


复杂 ? 简单 ”其 实 取 决 于 个 人 对 事物 的 认识 程度 ， 认 识 得 越 多 ， 
了 解 得 越 深 刻 ， 那 么 束 越 接近 本 质 ， 而 本 质 往往 都 是 简单 的 ， 比 如 大 
名 鼎鼎 的 质 能 方程 ， 一 个 简单 的 式 子 就 解释 了 质量 与 能 量 的 关系 。 


计算 机 就 是 一 人 台 计 算 的 设备 ， 而 且 是 一 台 很 基础 的 计算 设备 ， 只 
能 计算 小 学 数学 课堂 上 讲授 的 四 则 运算 ,再 加 上 一 些 并 不 复杂 的 与 、 
或 、 非 等 逻辑 运算 ， 其 余 诸如 平方 、 开 方 、 微 分 、 积 分 等 都 是 做 不 了 
的 。 有 读者 会 有 疑惑 ， 你 说 得 太 简单 了 吧 ， 别 急 ， 且 听 我 慢 慢 道 来 。 


1.1.1 ”计算 机 的 简单 组 成 模型 


计算 机 的 组 成 有 三 大 部 分 : 处 理 器 (Central Processing Unit, 
CPU) 、 输 入 输出 (Input/Output，LO) 、 存 储 器 (Memory) o 处 理 
器 从 存储 器 中 获取 指令 ， 然 后 按照 指令 执行 一 定 的 操作 ， 输 入 /输出 用 
来 提供 运算 数据 、 显 示 运 算 结果 。 如 图 1-1 所 示 。 


存储 器 


xe N 


01011010 | | 
01101001 l 
KK y AHR A 


输入 
图 1-1 计算 机 的 简单 组 成 模型 


存储 器 中 存储 的 是 指令 ， 指 令 就 是 一 条 运算 命令 ， 比 如 : 将 a 与 b 
相 加 ， 结 果 存 储 到 c 中 ， 处 理 器 按照 命令 执行 即 可 。 目 前 的 计算 机 是 一 
个 二 进 制 的 世界 ， 所 有 的 信息 都 是 用 0、1 组 合 来 表示 的 ， 所 以 一 条 指 
令 就 是 一 串 0、1 编 码 ， 正 如 图 1-1 所 示 。 处 理 器 内 部 具有 译 码 功能 ， 用 
来 解释 接收 到 的 0、1 编 码 表 示 的 运算 类 型 ， 据 此 进行 运算 。 


112 ”计算 机 的 简单 使 用 模型 


我 们 使 用 计算 机 上 了 网、 办 公 ， 都 是 通过 一 定 的 应 用 程序 实现 的 ， 
而 这 些 应 用 程序 实际 就 是 一 批 指令 的 集合 ， 当 然 ， 这 里 的 “一 批 ” 指 的 
是 指令 的 数目 庞大 ， 实 际 上 种 类 是 非常 少 的 ， 只 有 几 百 条 ， 常 用 的 也 
就 几 十 条 。 通 过 这 些 指令 的 组 织 、 配 合 ， 就 实现 了 目前 丰富 多 彩 的 应 
用 。 


理论 上 ， 可 以 直接 使 用 0、1 编 码 进 行程 序 设计 ， 但 是 那样 显然 太 
不 方 便 、 容 易 出 和， 于 是 人 们 使 用 一 些 助 记 竺 来 表示 各 种 指令 ， BN 
是 汇编 指令 ， 使 用 汇编 程序 将 汇编 指令 翻译 为 计算 机 可 以 识别 的 0、1 
编码 ， 后 来 ， 又 发 明了 高 级 语言 ， 其 语法 、 使 用 方式 比 汇编 更 加 方 
便 、 更 加 易于 理解 。 一 般 使 用 编译 程序 将 高 级 语言 编写 的 程序 翻译 为 
汇编 指令 ， 然 后 再 使 用 汇编 程序 将 其 翻译 为 0、1 编 码 。 本 质 上 是 一 样 
的 。 如 图 1-2 所 示 。 


高 级 语言 编写 的 源 程序 


编译 | 


汇编 指令 汇编 指令 编写 的 源 程序 


汇编 | | 汇编 


计算 机 可 识别 的 0、1 编 公 


图 1-2 计算 机 的 简单 使 用 模型 


这 就 是 计算 机 的 简单 使 用 模型 ， 元 论 是 视频 软件 、 浏 览 器 ， 还 是 
其 他 任何 软件 ; 无 论 是 使 用 C# 开 发 、Java 开 发 ， 还 是 使 用 任何 其 他 语 
BHA; 无 论 是 在 Windows 环 境 下 运行 、Android 环 境 下 运行 ， 还 是 在 


其 他 任何 平台 下 运行 ; 无 论 是 在 ARM 处 理 上 运行 、Intel 处 理 器 上 运 
行 ， 还 是 在 其 他 任何 处 理 器 上 运行 ;无论 是 在 银河 二 号 这 样 的 大 型 机 
运行 、 个 人 使 用 的 PC 上 运行 ， 还 是 在 其 他 任何 机 器 上 运行 ， 都 遵循 这 
样 的 一 套 使 用 模型 。 


总 结 一 下 ， 计 算 机 只 识别 0、1 编 码 串 ， 任 何 程序 最 终 都 要 转变 为 
0、1 编 码 串 ， 而 且 0、1 编 码 的 种 类 是 有 限 的 ， 计 算 机 按照 0、1 编 码 的 
命令 进行 工作 。 这 样 一 说 ， 读 者 应 该 觉得 计算 机 很 简单 了 吧 。 


在 计算 机 中 处 于 核心 地 位 的 是 处 理 器 ， 也 称 为 CPU， 作 用 是 识别 
0、1 编 码 ， 据 此 进行 各 种 运算 和 数据 处 理 。 本 书 的 目标 就 是 实现 一 个 
CPU 。 


12 ”架构 与 指令 集 


类 似 于 不 同 国家 的 人 使 用 不 同 的 文字 ， 不 同 的 处 理 器 也 使 用 不 同 
的 指令， 这 样 ， 为 处 理 器 A 编写 的 程序 不 能 直接 在 处 理 器 B 上 使 用 ， 需 
要 重新 编写 ， 然 后 再次 编译 、 汇 编 后 才 可 使 用 ,减低 了 软件 的 移植 
性 。 显 然 ， 极 为 不 便 。 


IBM 为 了 让 自己 的 一 系列 计算 机 能 使 用 相同 的 软件 ， 免 去 重复 编 

写 软 件 的 痛苦 ， 在 它 的 System/360 计 算 机 中 引入 了 指令 集 架 构 
(Instruction Set Architecture, ISA) 的 概念 ， 将 编程 所 需要 了 解 的 硬 
件 信息 从 硬件 系统 中 抽象 出 来 ， 这 样 软件 人 员 就 可 以 面向 ISA 进 行 编 
程 ， 开 发 出 来 的 软件 不 经 过 修改 就 可 以 应 用 在 符合 该 ISA 的 所 有 计算 
机 上 。1ISA 用 来 描述 编程 时 用 到 的 抽象 机 器 ， 而 非 这 种 机 器 的 具体 实 


现 ， 从 软件 人 员 的 角度 来 看 ，ISA 包 括 一 套 指令 集 和 一 些 寄存 器 ， 知 
道 它们 就 可 以 编写 程序 了 。 


与 ISA 对 应 的 一 个 概念 是 微 架 构 (Microarchitecture) ， 后 者 是 前 
者 的 一 个 实现 ， 比 如 Intel 的 许多 处 理 器 都 是 遵循 x86 的 ISA， 但 是 每 一 
款 处 理 器 都 有 自己 的 微 架构 。ISA 好 比 是 设计 规范 ， 微 架构 则 是 具体 
实现 ， 同 样 的 ISA， 不 同 的 微 架构 ， 会 带 来 不 同 的 性 能 。 


1.2.1 CISCSRISC 


从 大 的 方面 ， 根 据 ISA 的 不 同 可 以 将 计算 机 分 为 两 类 : 复杂 指令 
集 计 算 机 (Complex Instruction Set Computer, CISC) 和 精简 指令 集 计 
算 机 (Reduced Instruction Set Computer, RISC) 。 它 们 的 主要 区 别 
是 ，CISC 的 每 条 指令 对 应 的 0、1 编 码 串 长 度 不 一 ， 而 RISC 的 每 条 指令 
对 应 的 0、1 编 码 串 长 度 是 固定 的 。 


在 计算 机 发 展 的 早期 ， 人 们 使 用 汇编 语言 编程 ， 偏 好 强大 好 用 的 
目 令 集 ， 处 理 器 的 设计 人 员 于 是 将 指令 集 设计 得 更 强大 、 更 灵活 ， 并 
且 那 个 时 期 的 存储 器 既 昂 贵 且 速 度 慢 ， 因 此 指令 使 用 了 变 长 编码 ， 以 
节约 存储 空间 ， 由 于 一 条 指令 就 能 完成 很 多 功能 ， 从 而 减少 了 对 内 存 
的 访问 次 数 ， 这 样 也 减少 了 缓慢 的 存储 器 访问 对 程序 性 能 的 影响 。 典 
型 的 CISC 指 令 集 架构 就 是 Intel 的 x86 ISA。 上 世纪 70 年 代 中 期 ， 人 们 发 
现 CISC 指 令 集中 的 各 种 指令 ， 其 使 用 频率 相差 悬殊 ， 大 约 有 20% 的 指 
令 会 被 反复 使 用 ， 占 整个 程序 代码 的 80%。 而 余下 80% 的 指令 却 不 经 
常 使 用 ， 只 占 整 个 程序 代码 的 20%， 显 然 ， 这 种 结构 是 不 太 合理 的 。 
于 是 人 们 提出 将 指令 集 和 处 理 器 进行 重新 设计 ， 减 少 那些 使 用 不 多 的 
指令 ， 只 保留 常用 的 简单 指令 ， 这 样 处 理 器 就 不 需要 浪费 太 多 的 晶体 


管 去 做 那些 很 复杂 又 很 少 使 用 的 功能 ， 于 是 产生 了 RISC。1979 年 美国 
加 州 大 学 伯克利 分 校 的 David Pattern 首 先 提 出 了 RISC 的 概念 ，RISC 并 
不 只 是 简单 地 减少 指令 ， 更 主要 的 目的 是 研究 如 何 使 计算 机 的 结构 更 
加 简单 合理 以 提高 运算 速度 。 其 特点 是 指令 长 度 固 定 、 指 令 格式 种 类 
少 、 寻 址 方式 种 类 少 、 大 量 使 用 寄存 器 等 。 由 于 在 RISC 中 使 用 的 指令 
大 多 数 是 简单 指令 且 都 能 在 一 个 时 钟 周 期 内 完成 ， 因 而 处 理 器 的 频率 
得 以 大 幅 提 升 ， 同 时 易于 设计 流水 线 。RISC 是 计算 机 发 展 历史 上 的 一 
个 里 程 碑 ， 以 致 有 人 开玩笑 地 把 RISC 定 义 为 : 1985 年 之 后 发 布 的 所 有 
处 理 器 。 


Intel 也 尝试 做 RISC 处 理 器 ， 但 是 因为 兼容 性 问题 ， 没 有 成 功 ， 后 
来 在 1995 年 ，Intel 的 David B.Papworth 和 他 的 同事 一 起 设计 了 Pentium 
Pro 处 理 器 ， 在 这 个 处 理 器 中 ，x86 指 令 先 被 解码 为 类 似 于 RISC 指 令 的 
MRE (microoperation, ， 简 称 为 uops) ， 之 后 的 执行 过 程 采 用 RISC 内 
核 ， 这 种 方式 一 直 延 续 至 今 。 


1.2.2 ”主要 的 几 种 ISA 


目前 并 没有 一 种 统一 的 ISA 为 各 个 处 理 器 厂商 所 接受 ， 而 是 存在 
多 种 I SA， 就 像 这 个 世界 存在 多 种 语言 一 样 ， 但 是 主要 的 语言 只 有 几 
种 : 汉语 、 喘 语 、 法 语 、 俄 语 等 。 主 要 的 ISA 也 只 有 几 种 : x86、 
ARM、SPARC、POWER、MIPS， 除 了 x86 是 CISC ISA 外 ， 其 余 都 是 
RISC ISA。 


1. x86 


x86 架 构 于 1978 年 推出 的 Intel 8086 处 理 器 中 首 度 出 现 ， 三 年 后 ， 
Intel 8086 为 IBM PC 所 选用 ， 之 后 x86 便 成 为 了 个 人 计算 机 的 标准 平 
台 ， 成 为 了 历史 上 最 成 功 的 指令 集 架构 。 目 前 绝 大 多 数 个 人 计算 机 使 
用 的 都 是 兼容 x86 指 令 集 架构 的 处 理 器 。 


2. ARM 


1985 年 ， 英 国 的 Acormn 公 司 设计 了 自己 的 第 一 代 32 位 、6MHz 处 理 
器 ， 命 名 为 Acorn RISC Machine， 简 称 为 ARM1。1990 年 ， 由 苹果 公 
司 、VLSI 公 司 共 同 出 资 ， 改 组 Acorn 为 ARM 计 算 机 公司 ， 同 时 不 再 涉 
足 具体 芯片 生产 ， 只 出 售 IP 核 。ARM 公 司 设计 低 功 耗 、 高 性 能 的 CPU 
内 核 ， 然 后 授权 给 其 他 公司 ， 后 者 设计 生产 具体 的 处 理 器 心 片 。 


由 于 ARM 侧 重 于 低 功 耗 、 低 成 本 ， 主 要 面向 的 是 能 入 式 应 用 ， 故 
随 着 智能 手机 、 平 板 等 移动 设备 的 普及 ，ARM 公 司 发 展 得 非常 迅速 。 


ARM##]Mv4, v4T, v5, v5E, v6, 发展 到 v7， 其 中 v7 又 分 为 
V7-A、vVv7-R、v7-M 等 多 种 ， 苹 果 公 司 的 A9 处 理 器 采用 的 就 是 ARM v7- 
A 架构 。 


3. SPARC 


SPARC (Scalable Processor ARChitecture， 可 扩展 处 理 器 架构 ) TR 
自 美 国 加 州 大 学 伯克利 分 校 上 世纪 80 年 代 的 研究 ， 由 Sun 公 司 在 1985 
年 首先 提出 。1989 年 成 为 商用 架构 ， 生 产 出 SPARC 系 列 的 处 理 器 ， 
Sun 将 其 用 在 高 性 能 工作 站 和 服务 器 上 。SPARC 架 构 目 前 的 版 本 有 


V8、 V9o 


SPARC 架 构 对 外 完全 开放 ， 在 此 基础 上 出 现 了 一 些 开放 源 代码 的 
处 理 器 ， 比 如 : Sun 公 司 的 UltraSPARC T1、LEON 等 。 其 中 ，LEON 是 
一 种 SPARC v8 架 构 的 处 理 器 ， 至 今 已 发 布 到 了 LEON4。 最 初 的 
LEON1 与 LEON2 由 欧洲 航天 局 发 布 ，LEON3 由 Gaisler Research 公 司 设 
计 发 布 ，2008 年 Aeroflex 收 购 了 Gaisler Research 公 司 ， 并 于 2010 年 1 月 
发 布 『 了 LEON4， 不 过 LEON4 人 至 今 还 没有 公布 兰 代 码 。LEON 系 列 使 用 
VHDL 编 写 代 码 ， 原 计划 是 使 用 在 航天 器 上 。 


4. POWER 


POWER (Performance Optimization With Enhanced RISC) 是 由 
IBM 公 司 设计 开发 的 一 种 RISC 结 构 的 指令 集 架 构 。IBM 生 产 的 很 多 服 
务 器 、 大 型 机 、 小 型 机 及 工作 站 都 采用 POWER 架构 的 微 处 理 器 作为 其 
主 CPU 使 用 。 


1991 年 Apple、IBM 和 Motorola 三 家 公司 成 立 了 AIM 联 盟 (AIMA 
Apple、IBM、Motorola 的 首 字 母 ) ， 对 POWER 架构 进行 了 修改 ， 形 
成 了 PowerPC 架 构 。2004 年 IBM 发 起 了 Powerorg 联 盟 ， 发 布 了 统一 的 
指令 集 架 构 ， 将 POWER 与 PowerPC 统 一 到 新 的 Power 架 构 中 。 


5. MIPS 


MIPS 的 含义 是 无 内 锁 流 水 线 微 处 理 器 (Microprocessor without 
Interlocked Piped Stages) ， 是 上 世纪 80 年 代 诞生 的 RISC CPU 的 重要 代 
表 ， 其 设计 者 John Hennessy 时 任 斯 坦 福 大 学 的 教授 。 当 初 的 设计 基于 
以 下 理念 : 使 用 相对 简单 的 指令 ， 结 合 优秀 的 编译 器 以 及 采用 流水 线 
执行 指令 的 硬件 ， 就 可 以 用 更 少 的 晶 元 面积 生产 更 快 的 处 理 器 。 这 一 
理念 是 如 此 的 成 功 ， 以 至 于 1984 年 就 成 立 了 MIPS 计 算 机 系统 公司 对 


MIPS 架 构 进 行商 业 化 。 在 随后 的 十 几 年 中 ， MIPS 架 构 在 很 多 方面 得 
到 发 展 ， 在 工作 站 和 服务 器 系统 中 得 到 了 很 多 应 用 。MIPS 架 构 也 从 
MIPS I, MIPS II, MIPS III, MIPS IV, MIPS V, MIPS32 发展 到 
MIPS640 John Hennessy 5 RISCH MAA tEW SB David Pattern 合 著 了 计算 
机 领域 影响 甚 广 的 教科 书 《 计 算 机 体系 结构 量化 研究 方法 》， 该 
书 至 今 已 出 到 第 五 版 。 


国内 的 龙芯 处 理 器 采用 的 就 是 MIPS 架 构 。 本 书 计 划 实 现 的 处 理 器 
也 采用 MIPS 架 构 ， 这 里 涉及 两 个 问题 。 


(1) 为 什么 要 采用 一 个 现 有 的 指令 集 架 构 ? 


这 是 因为 现 有 的 指令 集 架构 已 经 形成 了 一 套 完善 的 环境 ， 其 中 既 
有 成 熟 的 编译 器 ， 还 有 大 量 的 应 用 程序 ， 采 用 现 有 的 指令 集 染 构 ， 都 
可 以 直接 使 用 这 些 环境 。 反 之， 如 果 设 计 自己 独 有 的 一 套 指令 集 架 
构 ， 那 么 编译 器 、 应 用 软件 都 需要 自己 重新 开发 ， 工 作 量 巨大 。 还 是 
以 语言 作 比喻 ， 一 个 人 当然 可 以 发 明 、 使 用 自己 独 有 的 语言 ， 但 是 如 
何 与 别人 交流 呢 ? 无 法 与 人 交流 ， 再 优秀 的 语言 也 注定 会 消失 。 


(2) 为 什么 要 采用 MIPS 架 构 ? 


首先 MIPS 的 设计 是 RISC 架 构 中 的 经 典 之 作 ， 很 多 处 理 器 都 吸收 
了 其 中 的 设计 思想 ， 其 次 ，MIPS 架 构 中 指令 的 专利 期 已 过 ， 可 以 自由 
使 用 。 


本 章 接 下 来 将 重点 介绍 MIPS 指 令 集 架构 。 


1.3 MIPS 指 令 集 架 构 的 演变 


MIPS 指 令 集 架 构 自 上 世纪 80 年 代 出 现 后 ， 一 直 在 进行 更 新 换代 ， 
从 最 初 的 MIPS I 到 MIPS V， 发 展 到 可 支持 扩展 模块 的 MIPS32、 
MIPS64 系列 ， 再 到 集成 代码 压缩 技术 的 microMIPS32、 
microMIPS64。 每 个 MIPS ISA 都 是 其 前 一 个 的 超 集 ， 没 有 任何 遗漏 ， 
只 有 增加 新 的 功能 。 


1. MIPS | 


提供 加 载 / 存 储 、 计 算 、 跳 转 、 分 支 、 协 处 理 及 其 他 特殊 指令 。 该 
指令 集 架 构 用 于 最 初 的 MIPS 处 理 器 R2000/R3000。R2000 是 1985 年 推 
出 的 首 款 MIPS CPU ， 由 110000 个 晶体 管 组 成 ， 是 一 个 8MHz 的 32 位 处 
理 器 。R3000 是 R2000 的 下 一 代 产 品 ， 与 前 者 相 比 仅仅 是 时 钟 频率 不 同 
而 已 。 


2。MIPS | 


增加 了 自 陷 指令 、 链 接 加 载 指 令 、 条 件 存 储 指令 、 同 步 指令 、 可 
能 分 支 指令 、 平 方 根据 令 。 最 初 计 划 用 在 MIPS 处 理 器 R6000 上 ， 但 由 
于 工艺 选择 的 问题 ，R6000 从 1988 年 开始 设计 后 ， 就 一 直 问 题 不 断 ， 
最 终 未 能 大 规模 生产 。 但 MIPS Il 指令 集 架 构 是 后 期 MIPS32 指 令 集 架 
构 的 直接 先驱 。 


3. MIPSIII 


提供 了 32 位 指令 集 ， 同 时 支持 64 位 指令 集 。 最 初 用 于 MIPS 处 理 器 
R4000。R4000 是 于 1991 年 推出 的 64 位 处 理 器 ， 首 次 加 入 了 浮 点 处 理 器 
单元 ， 主 时 钟 频 率 提高 到 了 100MHz。 后 来 出 现 了 一 系列 的 R4000 处 理 
器 。 


4. MIPSIV 


在 MIPS Io LISI SAAB OES. MRSC UNER 
指令 。 最 初 用 于 MIPS 处 理 器 R8000 ， 后 来 应 用 于 R5000/R10000。 
R5000 与 R10000 虽 然 使 用 相同 的 指令 集 架构 ， 但 是 两 者 微 架 构 的 设计 
理念 完全 不 同 。R5000 于 1995 年 推出 ， 采 用 的 是 经 典 的 五 级 流水 线 、 
顺序 执行 。R10000 于 1996 年 推出 ， 采 用 的 是 乱 序 执行 。 


5. MIPSV 


在 MIPS IV 的 基础 上 增加 了 可 以 提高 代码 生产 效率 和 数据 转移 效 
率 的 指令 。 但 是 没有 任何 一 个 处 理 器 基于 该 架构 。MIPS V 指 令 集 架构 
是 后 期 MIPS64 指 令 集 架构 的 直接 先驱 。 


6. MIPS32/64 


MIPS32/64 于 1998 年 提出 ，MIPS32 以 MIPS II 架构 为 基础 ， 选 择 性 
地 加 入 了 MIPS III、MIPS IV、MIPS V， 提 高 了 代码 生成 和 数据 移动 的 
效率 。MIPS64 以 MIPS V 架 构 为 基础 ， 同 时 兼容 MIPS32。 该 架构 第 一 
次 包含 了 被 称 为 协 处 理 器 0 的 “CPU 控制 ?功能 。1999 年 以 后 设计 的 大 多 
数 MIPS 处 理 器 都 与 该 标准 兼容 。2003 年 ， 发 布 了 MIPS32/64 指 令 集 架 
WEISEN (Release 2) ， 也 称 为 MIPS32/64 R2。 最 新 的 是 第 五 版 
(Release 5) ， 也 称 为 MIPS32/64 R5。 但 目前 广泛 使 用 的 是 第 二 版 ， 
非常 成 功 的 MIPS 4K、24K 系 列 处 理 器 遵循 的 就 是 MIPS32 R2 架 构 。 


MIPS32/64 在 基本 指令 的 基础 上 ， 还 提供 了 一 些 面向 特定 应 用 的 
BS, ， 这 些 指令 采用 特定 应 用 扩展 (Application-Specific Extensions, 
ASE) 的 形式 。 一 种 处 理 器 是 否 实现 了 某 种 扩展 ， 可 以 通过 设置 标准 
的 配置 寄存 器 指明 。 主 要 的 扩展 列举 如 下 。 


。 MIPS 16e: EE IARMATDAARE SARE TD RAY 
用 而 设计 的 ， 可 以 在 一 个 程序 中 执行 16 位 和 32 位 两 种 混合 长 
度 的 指令 ， 能 使 最 终 代码 长 度 减少 40%。MIPS32、MIPS64 都 
支持 MIPS 16e。 

SmartMIPS: 是 为 了 满足 智能 卡 和 灵活 小 系统 的 市 场 需要 而 
设计 的 ， 是 一 套 能 高 效 节省 存储 空间 的 扩展 指令 集 ， 此 外 还 
能 提高 智能 卡 领域 非常 关键 的 加 密 运 算 的 性 能 。MIPS32 支 持 
SmartMIPSo 

MIPS-3D: 提供 了 更 好 的 几何 运算 处 理 ， 具 有 成 对 单 精度 数 
据 类 型 ， 还 提供 专用 指令 来 加 快 对 该 类 型 数据 的 处 理 。 
MIPS64 支 持 MIPS-3D， MIPS32 第 二 版 也 支持 MIPS-3D。 
MCU: Micro-Control Unit 微 控制 单元 ， 增 强 了 内 存 映 射 IO 的 
处 理 、 提 供 了 更 低 的 中 断 延 迟 。MIPS32、MIPS64 都 支持 
MCU。 


7. microMIPS32/64 


microMIPS32/64 指 令 集 架构 集成 了 16 位 和 32 位 优化 指令 的 高 性 能 
代码 压缩 技术 ， 保 持 了 98% 的 MIPS32 性 能 ， 同 时 至 少 减少 了 30% 的 代 
码 体 积 ， 从 而 降低 芯片 成 本 ， 也 有 助 于 降低 系统 功 耗 。MIPS M14K 内 
核 是 MIPS 科 技 于 2009 年 发 布 的 首 款 遵循 microMIPS 指 令 集 架构 的 
MIPS32 兼 容 内 核 。 


MIPS 指 令 集 架 构 的 演变 可 以 使 用 图 1-3 描 述 。 注 意图 中 没有 
Release 4， 这 是 因为 对 于 很 多 人 来 说 ，4 是 个 不 吉利 的 数字 ， 所 以 
MIPS 没 有 发 布 Release 4， 而 是 直接 发 布 Release 5。 
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图 1-3 ”MIPS 指 令 集 架 构 的 演变 


1.4 ”MIPS32 指 令 集 架构 简介 


本 书 设计 的 处 理 器 遵循 MIPS32 Release 1 架构 ， 所 以 本 节 介 绍 的 
MIPS32 指 令 集 架构 指 的 就 是 MIPS32 Release 1。 


1.4.1 ”数据 类 型 
指令 的 主要 任务 就 是 对 操作 数 进行 运算 ， 操 作 数 有 不 同 的 类 型 和 
长 度 ，MIPS32 提 供 的 基本 数据 类 型 如 下 。 


。 位 (b) : 长 度 是 1bit。 
。 字 节 (Byte) : 长 度 是 8bit。 


e +> (Half Word) : 长 度 是 16bit。 
。 字 (Word) : 长 度 是 32bit。 
e WF (Double Word) : 长 度 是 64bit。 


此 外 ， 还 有 32 位 单 精度 浮 点 数 、64 位 双 精 度 浮 点 数 等 。 


1.4.2 ”寄存 器 


在 前 文 介绍 RISC 的 特点 时 提 到 一 点 : 大 量 使 用 寄存 器 。 这 是 因为 
寄存 器 的 存 取 可 以 在 一 个 时 钟 周期 内 完成 ， 同 时 也 简化 了 寻 址 方式 。 
MIPS32 的 指令 中 除 加 载 /存储 指令 外 ， 都 是 使 用 寄存 器 或 立即 数 作为 
操作 数 的 。MIPS32 中 的 寄存 器 分 为 两 类 : 通用 寄存 器 (General 
Purpose Register, GPR) 、 特 殊 寄存 器 。 


1. 通用 寄存 器 


MIPS32 架 构 定 义 了 32 个 通用 寄存 器 ， 使 用 $0、$1...$31 表 示 ， 都 
是 32 位 。 其 中 $0 一 般 用 做 常量 0。 


在 硬件 上 没有 强制 指定 寄存 器 的 使 用 规则 ， 但 是 在 实际 使 用 中 ， 
这 些 寄存 器 的 用 法 都 遵循 一 系列 约定 ， 例 如 : 寄存 器 $31 一 般 存放 子 程 
序 的 返回 地 址 。MIPS32 中 通用 寄存 器 的 约定 用 法 如 表 1-1 所 示 。 在 本 
书 大 部 分 章节 中 ， 测 试 程序 都 是 直接 使 用 汇编 指令 编写 的 ， 对 寄存 器 
的 约定 用 法 还 不 需要 十 分 在 意 ， 但 是 本 书 的 最 后 一 章 移植 hHC/OS-II 
时 ， 因 为 涉及 C 语 言 、 汇 编 混 合 编程 ， 对 寄存 器 的 约定 用 法 就 需要 十 
分 在 意 了 。 读 者 届时 可 以 体会 表 1-1 中 各 个 寄存 器 的 约定 用 法 。 


表 1-1 MIPS32 中 通用 寄存 器 的 约定 用 法 


= 约定 命名 
> p 留 作 汇 编 器 生成 一 些 合成 指令 


$4~$7 调用 子 程序 时 ， 使 用 这 4 个 寄存 器 传输 
5 a0~a3 ER = 
前 4 个 非 浮 点 参数 


sess oo 临时 寄存 器 ， 子 程序 使 用 时 可 以 不 用 
joo E KS 
子 程序 寄存 器 变量 ， 改 变 这 些 寄 存 器 

$16~$23 s0~s7 值 的 子 程序 必须 存储 旧 的 值 并 在 退出 
前 恢复 ， 对 调用 程序 来 说 值 不 变 
临时 寄存 器 ， 子 程序 使 用 时 可 以 不 用 

$26, $27 由 异常 处 理 程序 使 用 

San 

$29 或 $sp 堆栈 指针 


$30 或 $fp 子 程序 可 以 用 来 作 堆栈 帧 指针 
存放 子 程序 返回 地 址 


E 
IE 
0 
0 
ay 


2。 特 殊 寄 存 器 


MIPS32 架 构 中 定义 的 特殊 寄存 器 有 三 个 : PC (Program Counter 程 
序 计 数 器 ) 、HI (乘除 结果 高 位 寄存 器 ) 、LO 《乘除 结果 低位 寄存 
器 ) 。 进 行 乘法 运算 时 ，HI 和 LO 保存 乘法 运算 的 结果 ， 其 中 HI 存储 高 
32 位 ，LO 存 储 低 32 位 ; 进行 除法 运算 时 ，HI 和 LO 保存 除法 运算 的 结 
果 ， 其 中 HI 存储 余数 ，LO 存 储 商 。 


1.4.3 FPR 


数据 在 存储 器 中 是 按照 字 节 存放 的 ， 处 理 器 也 是 按照 字 节 访问 存 
储 器 中 的 指令 或 数据 ， 但 是 如 果 需 要 读 出 一 个 字 ， 也 就 是 4 个 字 节 ， 比 
Not 


如 读 出 的 是 mem[n]、mem[n+1]、mem[n+2]、mem[fn+3] 这 四 个 字 节 ， 


那么 最 终 交 给 处 理 器 的 有 两 种 结果 。 


e (mem[n],mem[n+1],mem[n+2],mem[n+3]) 


e {mem[n+3],mem[n+2],mem[n+1],mem|[n]} 


前 者 称 为 大 端 模 式 (Big-Endian) ， 也 称 为 MSB (Most Significant 
Byte) ， 后 者 称 为 小 端 模式 (Little-Endian) ， 也 称 为 LSB (Least 
Significant Byte) 。 在 大 端 模 式 下 ， 数 据 的 高 位 保存 在 存储 器 的 低地 址 
中 ， 而 数据 的 低位 保存 在 存储 器 的 高 地 址 中 。 图 1-4 给 出 0x12345678 在 
两 种 模式 下 的 存储 情况 。 本 书 实现 的 处 理 器 采用 的 是 大 端 模式 (Big- 
Endian) 。 


低地 址 高 地 址 
大 端 模式 12 34 56 78 
|. ig BK 78 56 34 12 


图 1-4 大 、 小 端 模式 下 存储 0x12345678 的 区 别 


1.4.4 ”指令 格式 


MIPS32 架 构 中 的 所 有 指令 都 是 32 位 ， 也 就 是 32 个 0、1 编 码 连 在 一 
起 表示 一 条 指令 ， 有 三 种 指令 格式 。 如 图 1-5 所 示 。 其 中 op 是 指令 码 、 
func 是 功能 码 。 


31 26 25 


21 20 16 15 11 10 6 5 0 
op rs rt rd sa func R 类 型 
6 位 5 位 5 位 5 位 5 位 6 位 
31 26 25 21 20 16 15 0 
op rs rt immediate I 类 型 
6 位 5 位 5 位 16 位 
31 26 25 0 
op address J 类 型 
6 位 26 位 


图 1-5 MIPS32 架 构 中 的 三 种 指令 格式 


(1) R 类 型 : 具体 操作 由 op、func 结 合 指定 ，rs 和 rt 是 源 寄 存 器 的 
编号 ，rd 是 目的 寄存 器 的 编号 ， 比 如 : 假设 目的 寄存 器 是 $3， 那 么 对 
应 的 rd 就 是 00011 (此 处 是 二 进 制 数 ) 。MIPS32 架 构 中 有 32 个 通用 寡 
存 器 ， 使 用 5 位 编码 就 可 以 全 部 表示 ， 所 以 rs、rt、rd 的 宽度 都 是 5 位 。 
sa 只 有 在 移 位 指令 中 使 用 ， 用 来 指定 移 位 位 数 。 


(2) I 类 型 : 具体 操作 由 op 指定 ， 指 令 的 低 16 位 是 立即 数 ， 运 算 
时 要 将 其 扩展 至 32 位 ， 然 后 作为 其 中 一 个 源 操作 数 参 与 运算 。 


(3) J 类 型 : 具体 操作 由 op 指定 ， 一 般 是 跳 转 指令 ， 低 26 位 是 字 
地 址 ， 用 于 产生 跳 转 的 目标 地 址 。 


1.45 BEER 


在 “计算 机 的 简单 使 用 模型 "中 已 经 介绍 过 ， 可 以 直接 使 用 0、1 编 
码 进行 程序 设计 ， 但 是 那样 显然 太 不 方便 、 容 易 出 错 ， 于 是 人 们 使 用 
一 些 助 记 符 来 表示 各 种 指令 ， 这 就 是 汇编 指令 ， 使 用 汇编 程序 将 汇编 
指令 翻译 为 计算 机 可 以 识别 的 0、1 编 码 。 也 就 是 将 汇编 指令 翻译 为 图 
1-5 所 示 的 格式 ， 这 样 处 理 器 就 可 以 识别 了 。MIPS32 架 构 中 定义 的 指 
令 可 以 分 为 以 下 几 类 。 注 意 : 其 中 不 包括 浮 点 指令 ， 因 为 本 书 实 现 的 
处 理 器 不 包含 浮 点 处 理 单元 ， 也 就 没有 实现 浮 点 指令 ， 所 以 此 处 不 介 


绍 浮 点 指令 。 
1。 逻 辑 操作 指令 


有 8 条 指令 : and、andi、or、ori、xor、xXori、nor、lui， 实 现 逻 辑 
与 、 或 、 异 或 、 或 非 等 运算 。 本 书 设计 的 处 理 器 实现 了 所 有 逻辑 操作 
指令 ， 将 在 第 4、5 章 详细 介绍 各 个 逻辑 操作 指令 的 格式 、 作 用 、 用 
法 ， 以 及 实现 过 程 。 


2. 移 位 操作 指令 


有 6 条 指令 : sll、sllv、sra、srav、srl、srlv。 实 现 逻 辑 左 移 、 右 
移 、 算 术 右 移 等 运算 。 本 书 设 计 的 处 理 器 实现 了 所 有 移 位 操作 指令 ， 


将 在 第 5 章 详细 介绍 各 个 移 位 操作 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 


过 程 。 
3。 移 动 操作 指令 


有 6 条 指令 : movn、movz、mfhi、mthi、mflo、mtlo， 用 于 通用 寄 
存 器 之 间 的 数据 移动 ， 以 及 通用 寄存 器 与 HI、LO 寄 存 器 之 间 的 数据 移 
动 。 本 书 设计 的 处 理 器 实现 了 所 有 移动 操作 指令 ， 将 在 第 6 章 详细 介绍 
各 个 移动 操作 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 


4. 算术 操作 指令 


有 21 条 指令 : add、addi、addiu、addu、sub、subu、clo、clz、 
sit, slti、 sitiu, situ, mul, mult, multu, madd, maddu, msub、 
msubu、div、divu， 实 现 了 加 法 、 减 法 、 比 较 、 乘 法 、 乘 累加 、 除 法 
等 运算 。 本 书 设计 的 处 理 器 实现 了 所 有 算术 操作 指令 ， 将 在 第 7 章 详 细 
介绍 各 个 算术 操作 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 


5. 转移 指令 


有 14 条 指令 : jr、jalr、j、jal、b、bal、beq、bgez、bgezal、 
bgtz、blez、bltz、bltzal、bne， 其 中 既 有 无 条 件 转 移 ， 也 有 条 件 转 
移 ， 用 于 程序 转移 到 另 一 个 地 方 执行 。 本 书 设计 的 处 理 器 实现 了 所 有 
转移 指令 ， 将 在 第 8 章 详细 介绍 各 个 转移 指令 的 格式 、 作 用 、 用 法 ， 以 
及 实现 过 程 。 


6. 加 载 存 储 指令 


有 14 条 指令 : Ib, lbu, Ih, lhu, I, Iw, Iwh lwr, sb, sc. sh, 
sw、swl、swr， 以 “]* 开 始 的 都 是 加 载 指令 ， 以 “s” 开 始 的 都 是 存储 指 


令 ， 这 些 指令 用 于 从 存储 器 中 读 取 数据 ， 或 者 向 存储 器 中 保存 数据 。 
本 书 设计 的 处 理 器 实现 了 所 有 加 载 存储 指令 ， 将 在 第 9 章 详细 介绍 各 个 
加 载 存储 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 


7. 协 处 理 器 访问 指令 


有 2 条 指令 : mtc0、mfc0， 用 于 读 取 协 处 理 器 CP0 中 某 个 寄存 器 的 
值 ， 或 者 将 数据 保存 到 协 处 理 器 CP0 中 的 某 个 寄存 器 。 本 书 设 计 的 处 
理 器 实现 了 所 有 协 处 理 器 访问 指令 ， 将 在 第 10 章 详细 介绍 协 处 理 器 、 
协 处 理 器 访问 指令 的 格式 、 作 用 、 用 法 ， 以 及 实现 过 程 。 


8. 异常 相关 指令 


有 14 条 指令 ， 其 中 有 12 条 自 陷 指令 ， 包 括 : teq、tge、tgeu、tlt、 
ttu、tne、teqi、tgei、tgeiu、tlti、tltiu、tnei， 此 外 还 有 系统 调用 指令 
syscall、 异 常 返回 指令 eret。 本 书 设 计 的 处 理 器 实现 了 所 有 异常 相关 指 
令 ， 将 在 第 11 章 详细 介绍 异常 相关 指令 的 格式 、 作 用 、 用 法 ， 以 及 实 
现 过 程 。 


9. HRES 


EAN. Pubs 
有 4 条 指令 : nop, ssnop, sync, pref, HAnope Sts Ss, ssnope 


一 种 特殊 类 型 的 空 指令 ，sync 指 令 用 于 保证 加 载 、 存 储 操 作 的 顺序 ， 
pref 指 令 用 于 缓存 预 取 。 本 书 设计 的 处 理 器 对 这 4 条 指令 进行 了 简化 并 
加 以 实现 ， 将 在 第 5 章 详细 介绍 简化 后 的 实现 过 程 。 


1.4.6” 寻 址 方式 


MIPS32 架 构 的 寻 址 模式 有 寄存 器 寻 址 、 立 即 数 寻 址 、 寄 存 器 相对 
寻 址 和 PC 相对 寻 址 四 种 。 其 中 寄存 器 相对 寻 址 、PC 相 对 寻 址 的 介绍 如 
is 


1) 寄存 器 相对 寻 址 


这 种 寻 址 模式 主要 是 加 载 /存储 指令 使 用 ， 其 将 一 个 16 位 的 立即 数 
做 符号 扩展 ， 人 然后 与 指定 通用 寄存 器 的 值 相 加 ， 从 而 得 到 一 个 有 效 地 
址 ， 如 图 1-6 所 示 。 


通用 寄存 器 GPR | | 16 位 立即 数 做 符号 扩展 
> 
> + < 
有 效 地址 


图 1-6 ”寄存 器 相对 寻 址 


(2) PC 相对 寻 址 


这 种 寻 址 模式 主要 是 转移 指令 使 用 ， 在 转移 指令 中 有 一 个 16 位 的 
立即 数 ， 将 其 左 移 两 位 并 作 符 号 扩展 ， 然 后 与 程序 计数 寄存 器 PC 的 值 
相 加 ， 从 而 获得 有 效 地 址 。 如 图 1-7 所 示 。 


程序 计数 寄存 器 PC | 16 位 立即 数 左 移 两 位 并 做 符号 扩展 


> + j< 
\ y) 


了 


有 效 地 址 


图 1-7 PC 相对 寻 址 


1.4.7 ” 协 处 理 器 CP0 


协 处 理 器 一 词 通常 用 来 表示 处 理 器 的 一 个 可 选 部 件 ， 负 责 处 理 指 
令 集 的 某 个 扩展 ， 拥 有 与 处 理 器 相 独 立 的 寄存 器 。MIPS32 架 构 提 供 了 
最 多 4 个 协 处 理 器 ， 分 别 是 CP0~CP3。 协 处 理 器 CP0 用 作 系 统 控 制 |， 
CP1、CP3 用 作 浮 点 处 理 单元 ， 而 CP2 被 保留 用 于 特定 实现 。 除 CPO0 外 
的 协 处 理 器 都 是 可 选 的 。 


协 处 理 器 CP0 的 具体 作用 有 : 配置 CPU 工作 状态 、 高 速 缓存 控 
制 、 异 常 控制 、 存 储 管 理 单 元 控制 等 。CP0 通 过 配置 内 部 的 一 系列 寄 
存 器 来 完成 上 述 工 作 。 本 书 设计 的 处 理 器 实现 了 CP0 的 部 分 功能 ， 将 
在 第 10 章 详 述 。 


pe 
148 FE 
在 处 理 器 运行 过 程 中 ， 会 从 存储 器 中 依次 取出 指令 ， 然 后 执行 ， 


但 是 有 一 些 事件 会 打 断 正常 的 程序 执行 流程 ， 这 些 事件 有 中 断 
(Interrupt) ~ MBH (Trap) 、 系 统 调 用 (System Call) 等 ， 统 称 为 异 


常 。 异 常 发 生 后 ， 处 理 器 会 转移 到 一 个 事先 定义 好 的 地 址 ， 在 那个 地 
址 有 异常 处 理 例 程 ， 在 其 中 进行 异常 处 理 ， 这 个 地 址 称 为 异常 处 理 例 
程 入 口 地 址 。 异 常 处 理 完成 后 ， 使 用 异常 返回 指令 eret， 返 回 到 异常 发 
生前 的 状态 继续 执行 。 本 书 设计 的 处 理 器 实现 了 对 硬件 复位 、 中 断 
(包含 软 中 断 、 硬 中 断 ) 、syscall 系 统 调用 、 无 效 指令 、 浇 出 、 自 陷 6 
种 异常 的 处 理 ， 将 在 第 11 章 详 述 。 


15 ”本 书 的 目标 与 组 织 方式 


本 书 的 目标 是 实现 一 款 兼 容 MIPS32 指 令 集 架构 的 处 理 器 ， 命 名 为 
OpenMIPS ， 该 处 理 器 是 通过 使 用 硬件 可 编程 语言 Verilog HDL 编写 代 
码 实 现 的 ， 编 写 后 的 代码 经 过 编译 可 以 下 载 到 FPGA 心 片上 ， 组 成 实 
际 的 硬件 电路 。 计 划 实 现 两 个 版 本 一 一 教学 版 OpenMIPS、 实 践 版 
OpenMIPSo 


教学 版 OpenMIPS 处 理 器 的 主要 设想 是 尽量 简单 ， 比 如 : 在 一 个 时 
钟 周期 内 可 以 取 到 指令 ， 完 成 存储 、 加 载 数据 ， 这 样 处 理 器 的 运行 情 
况 (主要 是 流水 线 的 运行 ) 就 比较 理想 化 ， 与 教科 书 相 似 ， 代 码 也 很 
清晰 简单 ， 便 于 使 用 其 进行 教学 、 学 术 研究 和 讨论 ， 也 有 助 于 学 生理 
解 课堂 上 讲授 的 知识 。 


实践 版 OpenMIPS 处 理 器 的 设计 目标 是 在 教学 版 OpenMIPS 的 基础 
上 实现 Wishbone 总 线 接口 ， 这 样 就 能 将 其 挂 接 在 wishbone 总 线 上 ， 从 
而 可 以 使 用 大 量 开源 的 SDRAM、Flash、GPIO、UART、LCD 等 模块 
的 控制 器 ， 组 成 一 个 SOPC (System-On-a-Programmable-Chip， 可 编程 
片上 系统 ) ， 完 成 特定 功能 ， 成 为 一 个 能 发 挥 实际 作用 的 处 理 器 。 


全 书 组 织 如 下 。 


为 了 方便 读者 理解 ， 在 第 2 章 将 对 FPGA、Verilog HDL 的 基础 知识 
做 一 介绍 。 


第 3 章 介绍 教学 版 OpenMIPS 处 理 器 的 设计 蓝图 ， 包 括 设计 目标 、 
处 理 器 接口 ， 以 及 最 终 完成 时 ， 组 成 OpenMIPS 的 各 个 模块 的 作用 ， 力 
图 使 读者 有 一 个 整体 认识 。 并 在 本 章 详 述 了 OpenMIPS 处 理 器 的 实现 方 
法 。 


随后 的 第 4 一 11 章 ， 从 最 简单 的 情况 开始 ， 通 过 依次 添加 实现 逻辑 
操作 指令 、 移 位 操作 指令 、 空 指令 、 移 动 操作 指令 、 算 术 操 作 指 令 、 
转移 指令 、 加 载 存 储 指令 、 协 处 理 器 访问 指令 、 异 单 相关 指令 ， 最 终 
实现 教学 版 OpenMIPS 处 理 器 。 在 每 一 类 指令 的 实现 过 程 中 ， 都 是 先 介 
绍 该 类 指令 的 格式 、 作 用 、 用 法 ， 然 后 介绍 实现 思路 ， 接 着 通过 修改 
代码 实现 该 类 指令 ， 最 后 ， 编 写 测 试 程 序 ， 使 用 仿真 的 方式 验证 是 否 
正确 实现 。 


第 12 章 实现 了 实践 版 OpenMIPS 处 理 器 。 


第 13 章 设计 实现 了 基于 实践 版 OpenMIPS 的 小 型 SOPC， 该 SOPC 包 
括 OpenMIPS 处 理 器 、SDRAM 控 制 器 、UART 控 制 器 、Flash 控 制 器 、 
GPIO 模 块 、 总 线 单元 。 


第 14 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 实际 的 硬件 平台 上 上， 编写 
测试 程序 ， 验 证 实践 版 OpenMIPS 是 否 正 确实 现 。 


第 15 章 介绍 骨 入 式 实时 操作 系统 hC/OS-I， 并 将 其 移植 到 本 书 设 
计 的 OpenMIPS 处 理 器 上 ， 进 一 步 验证 了 实践 版 OpenMIPS 处 理 器 实现 


的 正确 性 ， 也 为 OpenMIPS 处 理 器 发 挥 实际 作用 奠定 了 基础 。 


第 2 章 ”可 编程 逻辑 器 件 与 Verilog 
HDL 


通过 第 1 章 的 介绍 ， 读 者 应 该 知道 CPU 内 部 有 一 些 基本 的 电路 ， 比 
如 : 译 码 电路 、 运 算 电 路 、 控 制 电 路 ， 此 外 还 有 一 些 寄存 器 等 。 这 些 
电路 怎么 实现 呢 ? 当然 可 以 通过 一 大 堆 分 立 的 元 器 件 实现 ， 实 际 上 在 
2008 年 ， 美 国 加 州 的 游戏 开发 人 士 Steve Chamberlin 就 自己 制造 了 一 款 
8 位 CPU， 耗 时 18 个 月 ， 人 花费 1000 美 元 ， 总 共 使 用 了 1253 条 线 缆 ， 如 图 
2-1 所 示 ，Steve Chamberlin 为 它 起 了 一 个 十 分 贴切 的 名 字 一 一 BMOW 
(Big Mess of Wires) 。 


图 2-1 BMOW 的 背面 ( 左 ) 与 正面 


还 有 一 位 叫 Bil Buzbee 的 朋友 也 用 200 多 块 74 系 列 的 TTL 集成 电路 
纯 手工 制造 了 一 款 CPU。 


上 述 事件 只 是 证 明了 使 用 分 立 元 件 实现 CPU 的 可 行 性 ， 但 那 并 不 
是 实现 CPU 的 好 方法 ， 本 书 是 通过 “代码 +FPGA” 的 方式 实现 CPU 的 ， 
本 章 将 对 其 原理 进行 解释 ， 并 对 使 用 的 编程 语言 Verilog HDL 进行 介 
47) 
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2.1 可 编程 逻辑 器 件 概述 


FPGA 是 可 编程 逻辑 器 件 (Programmable Logic Device, PLD) 的 
一 种 。PLD 是 上 世纪 70 年 代 发 展 起 来 的 一 种 新 型 器 件 ， 它 的 应 用 和 发 
展 不 仅 简 化 了 电路 设计 ， 降 低 了 开发 成 本 ， 提 高 了 系统 可 靠 性 ， 而 且 
给 数字 系统 的 设计 方法 带 来 了 革命 性 的 变化 。 截 止 到 现在 ， 出 现 了 多 
种 工艺 、 不 同 原理 的 PLD， 如 下 。 


PLA (Programmable Logic Array) 可 编程 逻辑 阵列 

PAL (Programmable Array Logic) 可 编程 阵列 逻辑 

GAL (Generic Array Logic) 通用 阵列 逻辑 

PROM (Programmable Read-Only Memory) 可 编程 只 读 存 储 
AÑ 

EPLD (Erasable Programmable Logic Device) 可 擦 除 可 编程 
逻辑 器 件 

CPLD (Complex Programmable Logic Device) 复杂 可 编程 逻 
辑 器 件 

FPGA (Field Programmable Gate Array) 现场 可 编程 门 阵列 


按照 不 同 的 内 部 结构 可 以 将 PLD 器 件 分 为 如 下 两 类 。 
1。 基 于 乘积 项 (Product-Term) 结构 的 PLD 器 件 


任何 组 合 人 逻辑 电 路 消 数 均 可 化 为 “与 或 "表达 式 ， 用 “与 门 -或 i” 两 
级 电路 实现 ， 而 任何 时 序 电 路 又 都 可 以 由 组 合 电路 加 上 存储 元 件 ( 触 
发 器 ) 构成 。 因 此 ， 从 原理 上 说 ， 与 或 阵列 加 上 触发 器 的 结构 就 可 以 
实现 任意 的 数字 逻辑 电路 。 基 于 乘积 项 结构 的 PLD 器 件 的 主要 结构 就 


是 与 或 阵列 ， 通 过 灵活 配置 的 互 连 线 ， 实 现任 意 逻 辑 功 能 。 其 基本 结 
构 如 图 2-2 所 示 。 


— > a 

输 一 > 输入 5 或 输出 一 输 

A 缓冲 pá è 阵 > 绥 冲 oe 出 
— 电路 列 列 电路 Ly 
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图 2-2 ”基于 乘积 项 结构 的 PLD 器 件 结 构图 


基于 乘积 项 结构 的 PLD 器 件 由 输入 组 站 电路 、 与 阵列 、 或 阵列 和 
输出 缓冲 电路 四 部 分 组 成 。“ 与 阵列 "和 “或 阵列 ”是 主体 ， 主 要 用 来 实 
现 各 种 逻辑 遂 数 和 逻辑 功能 ， 输 入 缓冲 电路 用 于 产生 输入 信号 的 原 变 
量 和 反 变 量 ， 并 增强 输入 信号 的 驱动 能 力 ; 输出 缓冲 电路 主要 用 来 对 
将 要 输出 的 信号 进行 处 理 ， 既 能 输出 纯 组 合 逻 辑 信 号 ， 也 能 输出 时 序 
逻辑 信号 。 


PROM、PLA、PAL、GAL、EPLD 和 绝 大 部 分 CPLD 器 件 都 是 采 
用 乘积 项 (Product-Term) 结构 的 PLD， 内 部 基于 与 或 阵列 逻辑 ， 这 类 
器 件 多 采用 EEPROM 或 Flash 工 艺 制 作 ， 掉 电 后 不 会 丢失 配置 数据 ， 器 
件 规模 一 般 小 于 5000 门 。 


2. 基于 查找 表 (Look-Up Table, LUT) 结构 的 PLD 器 件 


基于 与 或 阵列 的 PLD 器 件 的 规模 不 容易 做 得 很 大 ， 于 是 设计 人 员 
又 开发 出 另外 一 种 可 编程 逻辑 器 件 ， 即 查找 表 结 构 。 其 原理 类 似 于 
ROM， 物 理 结构 基于 静态 存储 器 (MStatic RAM, SRA) 和 数据 选择 
器 (MUX) ， 通 过 查 表 方 式 实现 函数 功能 。 函 数值 放 在 SRAM 中 ， 


SRAM 的 地 址 线 即 输入 变量 ， 不 同 的 输入 通过 MUX 找 到 对 应 的 函数 值 
并 输出 。N 个 输入 项 的 逻辑 函数 可 以 由 一 个 2N 位 容量 的 SRAM 实 现 。 


图 2-3 是 用 2 输入 查找 表 实 现 2 输入 或 门 的 示意 图 。2 输 入 查找 表 中 
有 4 个 存储 单元 ， 用 来 存储 真 值 表 中 的 4 个 值 ， 输 入 变量 A、B 作 为 查找 
表 中 3 个 多 路 选择 器 的 地 址 选择 端 ， 根 据 A、B 值 的 组 合 从 4 个 存储 单元 
中 选择 一 个 作为 查找 表 的 输出 ， 即 实现 了 2 输入 或 门 的 逻辑 功能 。 


查找 表 结 构 的 功能 非常 强 ，N 个 输入 的 查找 表 可 以 实现 任意 N 个 输 
变量 的 组 合 逻 辑 函 数 。 从 理论 上 讲 ， 只 要 能 够 增加 输入 信号 线 和 扩 
大 存储 器 容量 ， 用 查找 表 就 可 以 实现 任意 输入 变量 的 函数 。 但 在 实际 
应 用 中 ， 查 找 表 的 规模 受 技 术 和 成 本 因素 的 限制 。 每 增加 一 个 输入 变 
量 ， 查 找 表 SRAM 的 容量 就 要 扩大 一 倍 ，SRAM 的 容量 与 输入 变量 数 N 
的 关系 是 2 倍 。8 输 入 变量 的 查找 表 需 要 256b 容 量 的 SRAM， 而 16 个 
输入 变量 的 查找 表 则 需要 64Kb 容 量 的 SRAM， 这 个 规模 已 无 法 忍受 。 
实际 上 ，FPGA 器 件 查 找 表 的 输入 变量 一 般 不 超过 5 个 ， 多 于 5 个 输入 
变量 的 逻辑 函数 可 由 多 个 查找 表 通 过 组 合 或 级 联 实现 。 
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2-3 ”用 2 输入 查找 表 实 现 或 门 功能 


绝 大 多 数 FPGA 器 件 都 是 基于 SRAM 查 找 表 结 构 实现 的 。 特 点 是 集 
成 度 高 (可 实现 百 万 逻辑 门 以 上 设计 规模 ) 、 逻 辑 功能 强 ， 可 实现 大 
规模 的 数字 系统 设计 和 复杂 的 算法 运算 ， 但 掉 电 后 会 丢失 配置 数据 ， 
需 外 挂 非 易 失 配置 器 件 以 存储 配置 效 据 ， 才 能 构成 可 独立 运行 的 系 
统 。 在 FPGA 内 部 一 般 还 会 集成 更 多 的 逻辑 功能 块 ， 如 存储 器 块 、DSP 
块 、 硬 件 乘法 器 、 数 字 锁 相 环 等 ， 用 以 满足 数字 信号 处 理 、 数 字 通 信 
等 应 用 的 需要 。 


本 书 最 终 实现 的 实践 版 OopenMIPS 处 理 器 就 将 下 载 到 FPGA 上 运 
行 ， 使 用 的 是 Altera 公 司 的 EP2C35 系 列 的 FPGA， 其 具有 33216 个 LE 
(Logic Element) ， 每 个 LE 主要 由 一 个 4 输入 查找 表 和 一 个 可 编程 的 
寄存 器 构成 。 


22 ”基于 PLD 的 数字 系统 设计 流程 


PLD 不 仅 是 技术 的 革新 ， 也 带 来 观念 的 革新 、 设 计 流 程 的 革新 ， 
基于 PLD 的 数字 系统 设计 流程 如 图 2-4 所 示 。 本 节 将 分 别 介绍 流程 中 的 
各 个 阶段 。 


设计 输入 
(原理 图 、HDL 文 本 ) 


ee 


-a de i 功能 仿真 
(逻辑 综合 、 优 化 ) m~ re? 


ve 
N 


PLD 布线 / 适 配 


(自动 优化 、 布 局 、 布 线 /K 一 时 序 仿真 
适 配 ) 
PLD 编程 下 载 ===! 在 线 测试 


图 2-4 基于 PLD 的 数字 系统 设计 流程 


2.2.1 ”设计 输入 


设计 输入 是 将 设计 者 所 设计 的 电路 以 开发 软件 要 求 的 某 种 形式 表 
达 出 来 ， 并 输入 到 相应 软件 中 的 过 程 。 设 计 输 入 有 多 种 方式 ， 最 常用 
的 是 原理 图 方式 和 HDL 文本 方式 两 种 。 


1. 原理 图 输入 


原理 图 (Schematic) 是 图 形 化 的 表达 方式 ， 使 用 元 件 符号 和 连 线 
来 描述 设计 。 原 理 图 输入 对 用 户 来 说 很 直观 ， 尤 其 对 于 表现 层次 结 
构 、 模 块 化 结构 更 为 方便 ， 适 合 描述 连接 关系 和 接口 关系 ， 而 描述 逻 
辑 功能 则 比较 烦琐 。 其 要 求 设计 工具 提供 必要 的 元 件 库 或 逻辑 宏 单 
元 。 如 果 输 入 的 是 较为 复杂 的 逻辑 或 者 元 件 库 中 不 存在 的 模型 ， 采 用 


原理 图 输入 的 方式 往往 很 不 方便 ， 此 外 ， 原 理 图 方式 的 设计 可 重用 
性 、 可 移植 性 也 差 一 些 。 


图 2-5 是 使 用 原理 图 输入 的 二 选 一 选择 器 的 电路 。 有 三 个 输入 : 
a0, al, s, 一 个 输出 y， 当 s 为 1 时 ， y 的 值 等 于 al 的 值 ， 当 s 为 0 时 ， y 的 
值 等 于 a0 的 值 。 


图 2-5 ”二 选 一 选择 器 
2. HDL 文本 输入 


硬件 描述 语言 (Hardware Description Language, HDL) 是 一 种 用 
文本 形式 来 描述 和 设计 电路 的 语言 。 设 计 者 可 利用 HDL 语 言 来 描述 自 
己 的 设计 ， 然 后 利用 相应 的 工具 进行 综合 ， 变 为 某 种 目标 文件 ， 最 后 
下 载 到 PLD 器 件 ， 实 现 具体 电路 。 目 前 常用 的 HDL 有 VHDL、 Verilog 
HDLE 等 。 


VHDL fi Verilog HDL 各 有 优点 ， 可 以 进行 算法 级 (Algorithm 
Levels) 、 寄 存 器 传输 级 (RTL) 、 门 级 (Gate Levels) 等 各 种 层次 的 
逻辑 设计 ， 也 可 以 进行 仿真 验证 、 时 序 分 析 等 。 由 于 HDL 语 言 的 标准 
化 ， 易 于 将 设计 移植 到 不 同 三 家 的 心 片 中 ， 信 号 参数 也 容易 改变 和 修 
改 。 此 外 ， 采 用 HDL 进 行 设计 还 具有 工艺 无 天 性 ， 使 得 设计 人 员 在 功 
能 设计 、 人 逻辑 验证 阶段 可 以 不 必 过 多 考虑 门 级 及 工艺 实现 的 具体 细 


节 ， 只 需 根据 系统 设计 的 要 求 ， 施 加 不 同 的 约束 条 件 ， 即 可 设计 出 实 
际 的 电路 。 如 下 是 使 用 Verilog HDL 实 现 的 二 选 一 选择 器 的 代码 。 


module mux2(a0, al, s, y); 
input s, a0, al; 
output y; 
assign y=s ? al:a0; 


endmodule 


ZS 31% FA Verilog HDL 实现 OpenMIPS 处 理 器 。 


222 ”综合 


RA (Synthesis) 是 将 较 高 级 抽象 层次 的 设计 描述 自动 转化 为 较 
低层 次 描述 的 过 程 。 有 以 下 几 种 综合 形式 。 


。 将 算法 表示 、 行 为 描述 转换 到 寄存 器 传输 级 (RTL) ， 即 从 
行为 描述 到 结构 描述 。 

e 将 RTL 级 描述 转换 到 人 逻辑 门 级 ， 称 为 逻辑 综合 。 

。 将 逻辑 门 表示 转换 到 PLD 器 件 的 配置 网 表 表 示 ， 有 了 配置 网 
表 就 可 完成 基于 PLD 器 件 的 系统 实现 。 


综合 器 残 是 能 够 目 动 实现 上 述 转换 的 软件 工具 ， 其 能 够 将 原理 图 
或 HDL 语 言 表 达 、 描 述 的 电路 编译 成 由 与 或 阵列 、RAM、 触 发 器 、 宵 
存 器 等 逻辑 单元 组 成 的 电路 网 表 。 


2.2.3 ”布局 布线 


布局 布线 可 以 理解 为 将 综合 生成 的 电路 网 表 映 射 到 具体 的 目标 
PLD 器 件 ， 并 产生 最 终 可 下 载 文 件 的 过 程 。 布 局 布线 将 绿 合 后 的 电路 
网 表 针 对 某 一 具体 的 目标 PLD 器 件 进行 逻辑 映射 ， 把 整个 设计 分 为 多 
个 适合 PLD 器 件 内 部 逻辑 资源 实现 的 逻辑 小 块 ， 并 根据 用 户 的 设 定 在 
速度 和 面积 之 间 做 出 选择 或 折 中 。 其 中 布局 是 将 已 分 割 的 逻辑 小 块 放 
到 PLD 器 件 内 部 逻辑 资源 的 具体 位 置 ， 并 使 它们 易于 连 线 ， 布 线 则 是 
利用 PLD 器 件 的 布线 资源 完成 各 功能 块 之 间 、 反 馈 信 号 之 间 的 连接 。 


布局 布线 完成 后 产生 如 下 一 些 重 要 的 文件 。 
(1) 心 片 资源 耗 用 的 情况 报告 。 


(2) 产生 延 时 网 表 结 构 ， 以 便于 进行 精确 的 时 序 仿真 ， 能 比较 精 
确 地 预测 未 来 心 片 的 实际 性 能 。 


(3) 器 件 编程 文件 ， 如 用 于 CPLD 编程 的 正 DEC、POF 等 格式 的 
文件 ; 用 于 FPGA 配 置 的 OF、JAM、BIT 等 格式 的 文件 。 


2.2.4 下 载 


把 布局 布线 过 程 中 产生 的 器 件 编程 文件 放 入 PLD 的 过 程 称 为 下 
载 。 通 常 将 对 CPLD 器 件 的 下 载 称 为 编程 ， 将 对 FPGA 器 件 的 下 载 称 为 
配置 (Configuration) 。 下 载 后 ，PLD 内 部 的 与 或 门 (对 FPGA 而 言 就 
是 查找 表 ) 会 按照 编程 文件 的 要 求 变化 ， 从 而 实现 了 设计 的 电路 。 


225 ”仿真 


从 图 2-4 中 可 发 现 其 中 有 仿真 环节 。 仿 真 (Simulation) 也 称 为 模 
拟 ， 是 对 所 设计 电路 的 功能 进行 检验 。 用 户 可 以 在 设计 过 程 中 对 整个 
系统 和 各 个 模块 进行 仿真 ， 即 在 计算 机 上 用 软件 验证 功能 是 否 正确 ， 
各 部 分 的 时 序 配 合 是 否 准确 。 如 果 有 问题 可 以 随时 进行 修改 ， 从 而 避 
免 了 逻辑 错误 。 规 模 越 大 的 设计 ， 越 需要 进行 仿真 。 


仿真 包括 功能 仿真 和 时 序 仿真 。 不 考虑 信号 时 延 等 因素 的 仿真 ， 
称 为 功能 仿真 ， 又 叫 前 仿真 ;时 序 仿真 又 称 后 仿真 ， 它 是 在 选择 具体 
器 件 并 完成 布局 布线 后 进行 的 包含 时 延 的 仿真 。 由 于 不 同 器 件 的 内 部 
时 延 不 一 样 ， 不 同 的 布局 、 布 线 方案 也 会 影响 时 延 ， 因 此 在 设计 实现 
中 ， 对 网 络 和 逻辑 块 进行 时 序 仿真 ， 分 析 定 时 关系 ， 估 计 设 计 性 能 是 
非常 必要 的 。 


本 书 实现 的 教学 版 OpenMIPS 处 理 器 就 是 主要 通过 仿真 来 验证 其 实 
现 是 否 正确 ， 只 有 实践 版 OpenMIPS 才 配置 到 具体 的 FPGA 心 片 中 。 


226 ”工具 介绍 


在 基于 PLD 的 数字 系统 设计 流程 的 每 一 个 阶段 都 有 相应 的 工具 文 
持 ， 有 些 工具 是 集成 的 ， 可 以 完成 整个 设计 流程 的 各 个 阶段 ， 有 些 工 
具 是 专门 针对 某 一 设计 阶段 的 。 本 书 在 设计 实现 OpenMIPS 处 理 器 时 使 
用 的 工具 如 下 。 


e 设计 输入 工具 : UltraEdit 
。 仿真 工具 : ModelSim 
e 集成 工具 : QuartusII 


为 实践 版 OpenMIPS 是 下 载 到 Altera 公 司 的 FPGA 心 片 中 ， 所 以 
集成 工具 使 用 的 是 Altera 公 司 的 QuartusII。 一 般 而 言 ， 集 成 工具 最 好 选 
择 目 标 PLD 心 片 厂商 提供 的 工具 ， 因 为 厂商 的 工具 会 针对 目 己 器 件 的 
工艺 特点 做 优化 设计 ， 从 而 提高 资源 利用 率 、 降 低 功 耗 、 改 善 性 能 。 


2.3 Verilog HDL 简介 


本 书 实现 的 OpenMIPS 处 理 器 是 使 用 Verilog HDL 编写 的 ， 所 以 本 
章 接 下 来 的 几 节 将 介绍 Verilog HDL 的 一 些 基 本 知识 ， 包 括 语法 、 结 构 
等 。 因 为 本 书 并 不 是 一 本 讲授 Verilog HDL 的 专门 书籍 ， 所 以 此 处 介绍 
的 内 容 并 不 是 Verilog HDL 的 全 部 ， 只 是 一 些 基础 知识 ， 以 及 在 
OpenMIPS 处 理 器 实现 过 程 中 会 使 用 到 的 知识 。 读 者 如 果 对 Verilog 
HDL 有 进一步 了 解 的 需求 ， 可 以 参考 相关 书籍 ， 这 方面 有 许多 非常 优 
秀 的 书籍 。 笔 者 推荐 《数字 系统 设计 与 Verilog HDL (第 4 版 ) 》， 本 
章 关 于 Verilog HDL 的 介绍 也 部 分 参考 了 该 书 。 


Verilog HDL 由 GDA (Gateway Design Automation) 公司 的 Phil 
Moorby 于 1983 年 首创 ， 之 后 ，Moorby 又 设计 了 Verilog-XL 仿 真 器 ， 
Verilog-XL 仿 真 器 的 大 获 成 功 ， 也 使 得 Verilog HDL 得 到 了 推广 使 用 。 
1989 年 ，Cadence 收 购 了 GDA，1990 年 ，Cadence 公 开发 布 了 Verilog 
HDL ， 并 成 立 了 OVI (Open Verilog International) 组织， 专门 负 责 
Verilog HDL 的 发 展 。 由 于 Verilog HDL 具有 简洁 、 高 效 、 易 用 、 功 能 强 
等 优点 ， 已 逐渐 为 众多 设计 者 所 接受 和 喜爱 ， 其 发 展 经历 了 几 个 关键 
TI Fo 


e 19954F, Verilog HDL 成 为 IEEE 标 准 ， 称 为 IEEE Standard 
1364-1995 (Verilog-1995) 。 


e 20014, IEEE Standard 1364-2001 (Verilog-2001) 获得 通 
过 ， 其 对 Verilog-1995 做 了 扩充 和 增强 。 另 外 ， 修 改 了 一 些 语 
法 结构 ， 使 之 更 易于 使 用 。 
2002 年 ， 为 了 使 综合 器 输出 的 结果 和 基于 IEEE Standard 
1364-2001 的 仿真 和 分 析 工 具 的 结果 相 一 致 ， 推 出 了 IEEE 
1364[1].1-2002 标 准 ， 其 对 Verilog HDL 的 RIL 级 综合 定义 了 一 
系列 的 建 模 准 则 。 
2005 年 Verilog HDL 再 次 进行 了 更 新 ， 即 IEEE Standard 
1364-2005 (Verilog-2005) 。 该 版 本 只 是 对 上 一 版 本 的 细微 
修正 。 这 个 版 本 还 包括 了 一 个 相对 独立 的 新 部 分 ， 即 Verilog- 
AMS (Analog and Mixed-Signal) ， 这 个 扩展 使 得 传统 的 
Verilog HDL 可 以 对 集成 模拟 和 混合 信号 的 系统 进行 建 模 。 


Verilog HDL 具有 下 述 特点 。 


(1) Verilog HDL 是 在 C 语 言 的 基础 上 发 展 而 来 的 ， 就 语法 结构 而 
Æ> Verilog HDL 继承 了 C 语 言 的 很 多 语法 结构 ， 两 者 有 许多 相似 之 
Ao 


(2) 既 适 于 可 综合 的 电路 设计 ， 也 可 胜任 电路 与 系统 的 仿真 。 


(3) 能 在 多 个 层次 上 对 所 设计 的 系统 加 以 描述 ， 从 开关 级 、 门 
级 、 寄 存 器 传输 级 (RIL) 到 行为 级 ， 都 可 以 胜任 ， 同 时 Verilog HDL 
不 对 设计 规模 施加 任何 限制 。 


(4) 灵活 多 样 的 电路 描述 风格 ， 可 进行 行为 描述 ， 也 可 进行 结构 
描述 ;支持 混合 建 模 ， 一 个 设计 中 的 各 个 模块 可 以 在 不 同 的 设计 层次 
上 建 模 和 描述 。 


(5) 内 置 多 种 基本 逻辑 门 ， 如 and、or 和 nand 等 ， 可 方便 地 进行 
RAMA; 内 置 多 种 开关 级 元 件 ， 如 pmos、nmos 和 cmos 等 ， 可 进 
行 开 关 级 的 建 模 。 


(6) 用 户 定 义 原 语 (UDP) 创建 的 灵活 性 。 用 户 定义 的 原 语 既 可 
以 是 组 合 逻 辑 ， 也 可 以 是 时 序 逻 辑 ， 通 过 编程 语言 接口 (PLD 机制 可 
进一步 扩展 Verilog HDL 语 言 的 描述 能 力 。 


24 Verilog HDL 中 模块 的 结构 


Verilog 程 序 的 基本 设计 单元 是 “模块 ” (Module) ， 一 个 模块 有 其 
特定 的 结构 ， 如 图 2-6 所 示 。 Verilog 的 模块 完全 定义 在 module 与 
endmodule 关 键 字 之 间 ， 每 个 模块 包括 四 个 主要 部 分 : 模块 声明 、 端 口 
定义 、 数 据 类 型 说 明和 逻辑 功能 描述 。 


module < 模块 名 > ( 


< 端口 定义 > 
< 数据 类 型 说 明 > 
< 敢 辑 功能 描述 > 


endmodule 


图 2-6 ”Module 的 基本 结构 


如 下 是 一 个 实现 32 位 加 法 器 的 模块 。 有 两 个 输入 信号 in1、in2， 
两 者 相 加 的 结果 通过 out 输 出 。 


assign out = in1 + in2， // 逻辑 功能 描述 


endmodule 


下 面 结合 该 加 法 器 的 例子 ， 对 Module 的 基本 结构 进行 说 明 。 
1. 模块 声明 


模块 声明 包括 模块 名 字 ， 以 及 输入 、 输 出 端口 列表 ， 其 格式 如 
下 。 


module 模块 名 (端口 1， 端 品 2， 端口 3.…) ; 
2. 端口 定义 


明确 说 明 模 块 端口 的 方向 〈 输 入 、 输 出 、 双 向 等 ) ， 其 格式 如 
下 。 


input 501, 502, 503 ..; // 输入 端口 
output 2501, 502, 503 ..; // 输出 端口 
inout i701, m02, 503 …， // 双向 端口 


3. 数据 类 型 说 明 


对 模块 中 所 有 用 到 的 信号 (包括 端口 信号 、 节 点 信号 等 ) 都 必须 
进行 数据 类 型 的 定义 。Verilog HDL 提 供 了 各 种 信号 类 型 ， 下 面 是 几 种 
定义 信号 类 型 的 例子 。 各 数据 类 型 的 具体 含义 将 在 2.5.2 节 详 述 


reg a; // 定义 信号 a 的 数据 类 型 为 reg 型 
wire[31:0] out ; // 定义 信号 out 的 数据 类 型 为 32 位 wire 型 


对 于 端口 ， 可 以 将 数据 类 型 说 明 与 端口 定义 放 在 一 条 语句 中 完 
成 ， 于 是 ， 上 文 的 32 位 加 法 器 可 以 改 为 如 下 形式 。 


module add32(ini, in2, out); 
input wire[31:0] ini, in2; // 将 端口 定义 与 类 型 说 明 放 在 一 条 


语句 中 
output wire[31:0] out; 


assign out = ini + in2; 


endmodule 


Fimo, xa) Lim EM. SESS e BA BB IE te ER FS BA 
中 ， 而 不 再 放 在 模块 内 部 ， 于 是 ， 上 文 的 32 位 加 法 器 还 可 以 改 为 如 下 
形式 ， 更 为 简便 。 


// 将 端口 定义 、 数 据 类 型 说 明 放 在 模块 声明 中 
module add32(input wire[31:0] ini, 
input wire[31:0] in2, 


output wire[31:0] out); 


assign out = ini + in2; 


endmodule 


4. 逻辑 功能 描述 


模块 中 最 核心 的 部 分 就 是 逻辑 功能 描述 ， 可 以 有 多 种 方法 在 模块 
中 描述 和 定义 逻辑 功能 。 几 种 基本 方法 如 下 ， 具 体内 容 将 在 2.6 节 详 


述 。 


。 用 assign 持 续 赋值 语句 定义 
。 用 always 过 程 块 定 义 
。 调用 元 件 (也 称 为 元 件 例 化 ) 


2.5 Verilog HDL 基 本 要 素 


251 ”常量 


Verilog FAY = (Constant) 有 三 种 : EN TM. SHB. E 
OpenMIPSAY SHWE AGA ST BBS, PLA, RNA TEA EZ 
单 量 。 其 格式 如 图 2-7 所 示 。 


< 位 宽 > ' < 进 制 > ”< 数字 > 


对 应 二 进 制 的 宽度 Ft | t 基于 进 制 的 数字 序列 


单 引 号 指定 数值 的 进 制 


h 或 H: 十 六 进 制 ”d 或 D: 十进制 
0 或 0: ”八进制 ”b 或 B: ”二进制 


图 2-7 整数 常量 的 格式 
一 些 整数 常数 的 例子 如 下 。 


8'b11000101 // 宽度 为 8 位 的 二 进 制 数 ， 数 值 为 11000101， 等 于 十 进 制 的 
197 
8'h8a // 宽度 为 8 位 的 十 六 进 制 数 ， 数 值 为 8a， 等 于 十 进 制 的 138 


5'027 // 宽度 为 5 位 的 八进制 数 ， 数 值 为 27， 等 于 十 进 制 的 23 
4'd10 // 宽度 为 4 位 的 十 进 制 数 ， 数 值 为 10 


如 果 疫 有 明确 指明 进 制 ， 那 么 默认 是 十 进 制 数 。 


252 ”变量 声明 与 数据 类 型 


Verilog 中 变量 声明 的 格式 如 图 2-8 所 示 。 只 有 数据 类 型 、 变 量 名 是 
必要 的 ， 其 他 部 分 都 可 以 省 略 。 如 果 省 略 符号 和 位 宽 ， 那 么 根据 数据 
类 型 设置 为 默认 值 。 如 果 省 上 略 元 素数 ， 那 么 默认 声明 元 素数 为 1。 


< 数据 类 型 > ”< 符号 > < 位 宽 > < 变量 名 > ”< 元 素数 > 


为 variable 或 net 型 本 部 分 可 省 略 


指定 符号 ， 可 以 为 signed 或 ARS 


unsigned， 本 部 分 可 省 略 


定义 数据 的 位 宽 ， 本 部 分 可 省 


Dr 


图 2-8 ”变量 声明 的 格式 
数据 类 型 可 以 是 net 型 、variable 型 ， 分 别 介绍 如 下 。 
1. net 型 变量 


net 型 相当 于 硬件 电路 中 各 种 物理 连接 ， 其 特点 是 输出 的 值 紧 跟 输 
入 值 的 变化 而 变化 。net 型 变量 包括 多 种 类 型 ， 如 表 2-1 所 示 。 


表 2-1 net 型 变量 


名 称 默认 位 宽 | ”默认 符号 含义 
ee ee ee ee 


wire, wire wi | | 无 符号 | 线 连 接 


tril、 tri0 有 上 拉 或 下 拉 
的 连接 
supply0、 下 
1 位 无 符号 
supply1 


本 书 在 实现 OpenMIPS 处 理 器 的 时 候 只 使 用 了 其 中 的 wire 类 型 。 
wire 是 最 常用 的 net 型 变量 ，Verilog HDL 模块 中 的 输入 、 输 出 信号 在 没 
有 明确 指定 数据 类 型 时 ， 都 被 默认 为 wire 型 。wire 型 信号 可 以 用 作 任 
何 表 达 式 的 输入 ， 也 可 以 用 作 assign 语 句 和 实例 元 件 的 输出 ， 如 前 文中 
的 32 位 加 法 器 对 out 信 号 的 赋值 。 对 于 综合 器 而 言 ，wire 型 变量 的 取 值 
可 为 0、1、X、Z， 其 中 0 表示 低 电 平 、 人 逻辑 0; 1 表示 高 电 平 、 逻 辑 1; 
义 表示 不 确定 或 未 知 的 逻辑 状态 ; Z 表 示 高 阻 态 。 如 果 没 有 赋值 ， 默 认 
为 高 阻 态 Z。 


2。variabIe 型 变量 


variable 型 变量 是 可 以 保存 上 次 写 入 数据 的 数据 类 型 ， 一 般 对 应 硬 
件 上 的 一 个 触发 器 或 锁 存 器 等 存储 元 件 ， 但 并 不 是 绝对 的 ， 在 综合 
综合 的 时 候 ， 会 根据 其 被 赋值 的 情况 来 具体 确定 是 映射 成 连 线 还 是 映 
射 为 存储 元 件 。variable 型 变量 也 包括 多 种 类 型 ， 如 表 2-2 所 示 。 本 书 
在 实现 OpenMIPS 处 理 器 的 时 候 只 使 用 了 其 中 的 reg 类 型 。 


表 2-2 variable 


默认 位 宽 默认 符号 


variable 型 变量 必须 在 过 程 语句 (initialvalways) 中 实现 赋值 ， 这 
种 赋值 方式 称 为 过 程 赋值 ， 将 在 2.6 节 详 述 。 


253 ME 


图 2-8 变 量 声明 格式 中 的 位 宽 如 果 为 1， 那 么 对 应 的 变量 为 标量 ， 
如 果 不 为 17， 那 么 对 应 的 变量 为 向 量 ， 默 认为 标量 。 向 量 的 位 宽 用 下 面 
的 形式 定义 。 


[MSB : LSB] 


冒号 左边 的 数字 表示 向 量 的 最 高 和 有效 位 MSB (Most Significant 
Bit) ， 冒 号 右边 的 数字 表示 向 量 的 最 低 有 效 位 LSB (Least Significant 
Bit) 。 例 如 。 
wire [3:0] bus; // 4 位 的 wire 型 向 量 bus ， 其 中 bus[3] 是 最 高 位 ， 


bus[9] 是 最 低位 
reg [31:5] ra; // 27 位 的 reg 型 向 量 ra， 其 中 ra[31] 是 最 高 位 ， 


ra[5] 是 最 低位 
reg [0:7] rc; // 8 位 的 reg 型 向 量 rc， 其 中 rc[0] 是 最 高 位 ，rc[7] 是 
最 低位 


有 a 


wire vectored [7:0] databus; // 使 用 关键 字 vectored， 表 示 是 向 量 
类 向 量 
reg scalared [31:0] rega; // 使 用 关键 字 scalared， 表 示 是 标量 
类 向 量 


如 果 没 有 明确 指出 ， 那 么 默认 是 标量 类 向 量 。 本 书 也 只 用 到 了 标 
量 类 向 量 ， 对 标量 类 向 量 可 以 任意 选中 其 中 的 一 位 或 相 邻 几 位 ， 分 别 
称 为 位 选择 (bit-select) 和 域 选 择 (part-select) 。 例 如 。 


A = rega[6]; // 位 选择 ， 将 向 量 rega 的 其 中 一 位 赋值 给 变量 A 
B = rega[5:2]; // 域 选择 ， 将 向 量 rega 的 第 5、4、3、2 位 赋值 给 变量 B 


在 OpenMIPS 的 实现 过 程 中 ， 使 用 了 和 存储器， 存储 器 可 看 作 是 二 维 
的 向 量 。 如 下 就 是 一 个 存储 器 的 定义 ， 定 义 了 一 个 深度 为 64， 每 个 元 
素 宽度 为 32bit 的 存储 器 。 


reg [31:0] mem[63:0]; // mem 是 深度 为 64， 字 长 为 32bit 的 存储 器 


25.4 BAN 


Verilog HDL 中 定义 的 运算 符 包 括 : 算术 运算 符 、 逻 辑 运 算 符 、 位 
运算 符 、 关 系 运 算 符 、 等 式 运算 符 、 缩 位 运算 符 、 移 位 运算 符 、 条 件 
运算 符 和 位 拼接 运算 符 。 详 情 如 表 2-3 所 示 。 


表 2-3 Verilog HDL 中 定义 的 运算 符 
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表 2-3 中 的 大 部 分 运算 符 都 很 好 理解 ， 本 书 不 再 详 释 ， 只 做 如 下 几 
Hi BR. 


(1) 等 式 运算 符 中 的 “==” 与 “===” 的 区 别 是 : 对 于 “==” 运 算 ， 参 
与 比较 的 两 个 操作 数 必须 逐 位 相等 ， 其 结果 才 为 1， 如 果 某 些 值 是 不 定 
态 X 或 高 阻 态 Z， 那 么 得 到 的 结果 是 不 定 值 X; 而 对 于 “===” 运 算 ， 则 


要 求 对 参与 运算 的 操作 数 中 为 不 定 态 X 或 高 阻 态 Zz 的 位 也 进行 比较 ， 两 
个 操作 数 必 须 完全 一 致 ， 其 结果 才 为 1， 否 则 结果 为 0。 例 如 。 


reg [4:0] a = 5'b11x01; 
reg [4:0] b = 5'b11x01; 


针对 上 面 的 a、b, “a==b” 的 返回 结果 为 X， 而 “a===b” 的 返回 结 
为 1。 

(2) 缩 位 运算 符 与 位 运算 的 运算 符号 、 远 辑 运算 法 则 都 是 一 样 
的 ， 但 是 缩 位 运算 符 是 对 单个 操作 数 进行 与 、 或 、 异 或 的 递 推 运算 ， 
它 放 在 操作 数 的 前 面 ， 能 够 将 一 个 矢量 减 为 一 个 标量 。 例 如 。 
reg [3:0] a; 


b = &a; // 等 效 于 b = ((a[o] € a[1]) € a[2]) & 
a[3] 


而 位 运算 需要 对 两 个 操作 数 按 对 应 位 分 别 进 行 逻 辑 运 算 ， 例 如 。 


wire [3:0] a = 4'b0011; 
wire [3:0] b = 4'b0101; 
那么 a&b = 4'b0001, alb = 4'b0111 


(3) 位 拼接 运算 符 : 用 来 将 两 个 或 多 个 信号 的 某 些 位 拼接 起 来 。 
其 格式 如 下 。 


{比特 序列 9， 比特 序列 1 .….，} 


例如 ， 在 进行 加 法 运算 时 ， 可 将 和 与 进位 输出 拼接 在 一 起 使 用 。 


input [3:0] ina,inb; // 加 法 输入 
output [3:0] sum; // 加 法 的 和 
output cout; // 进位 


assign {cout, sum} = ina + inb; // 将 和 与 进位 拼接 在 一 起 
位 拼接 还 可 以 用 来 重复 信号 的 某 些 位 ， 其 格式 如 下 。 
{重复 次 数 {被 重复 数据 }} 
利用 上 面 的 功能 ， 可 以 实现 对 信号 的 符号 扩展 ， 例 如 。 


// Y Data 的 F 5 位 进行 Y [HE ,s_data = 
{Data[7],Data[7],Data[7],Data[7],Data} 
wire [7:0] Data; 
wire [11:0] s_data; 


s_data = {{4{Data[7]}},Data}; 


(4) 运算 符 的 优先 级 如 图 2-9 所 示 。 


| ~ 高 优先 级 


低 优 先 级 


图 2-9 ”运算 符 的 优先 级 
2.6 Verilog HDL 行为 语句 
2.6.1 WEAN 


Verilog 定 义 的 模块 一 般 包 括 过 程 语句 ， 过 程 语句 有 两 种 : initial, 
always。 其 中 initial 常 用 于 仿真 中 的 初始 化 ， 其 中 的 语句 只 执行 一 次 ， 
而 always 中 语句 则 是 不 断 重 复 执 行 的 。 此 外 ， always 过 程 语 句 是 可 综 


合 的 ，initial 过 程 语 句 是 不 可 综合 的 。 
1. always 过 程 语句 


always 过 程 语句 的 格式 如 图 2-10 所 示 。 


always @ (< 敏感 信号 表达 式 >) 
begin 


// A) A A] 


end 


图 2-10 always 过 程 语 句 的 格式 


always 过 程 语 句 通 剃 是 带 有 触发 条 件 的 ， 触 发 条 件 瑟 在 敏感 信号 
表达 式 中 ， 敏 感 信号 表达 式 又 称 为 事件 表达 式 或 敏感 信号 列表 ， 当 该 
表达 式 中 变量 的 值 改变 时 ， 就 会 引发 其 中 语句 序列 的 执行 。 因 此 ， 敏 
感 信号 表达 式 中 应 列 出 影响 块 内 取 值 的 所 有 信号 。 


(1) 敏感 信号 表达 式 的 格式 


如 果 有 两 个 或 两 个 以 上 的 敏感 信号 时 ， 它 们 之 间 使 用 “or” 连 接 ， 
此 处 还 是 以 32 位 加 法 器 为 例 ，2.4 节 是 使 用 assign 直 接 赋 值 的 ， 其 实 也 
可 以 使 用 always 过 程 语 句 实现 。 只 要 被 加 数 in1、 加 数 in2 中 的 任何 一 个 
改变 ， 都 会 触发 jways 过 程 语句 ， 在 其 中 进行 加 法 运算 。 这 里 有 两 个 
sabe ein. in2， 使 用 “or” 连 接 。 


module add32(input wire[31:0] ini, 
input wire[31:0] in2, 
output reg[31:0] out); 


always @ (ini or in2) // 8 Ba1wa ys METE TIRA 


敏感 信号 列表 中 的 多 个 信号 可 以 使 用 逗号 隔 开 ， 上 面 的 32 位 加 法 
器 可 以 修改 为 如 下 形式 。 


敏感 信号 列表 也 可 以 使 用 通配符 “*”， 表 示 在 该 过 程 语 句 中 的 所 有 
输入 信号 变量 ， 上 面 的 32 位 加 法 器 可 以 修改 为 如 下 形式 。 


module add32(input wire[31:0] ini, 
input wire[31:0] in2, 
output reg[31:0] out); 


always @ (*) N ARATE EA PRA BA ES 
TE 


begin 
Out = ant + Ae 


end 


endmodule 
(2) 组 合 电路 与 时 序 电路 


敏感 信号 可 以 分 为 两 种 类 型 : 一 种 为 电 平 敏感 型 ， 另 一 种 为 边沿 
敏感 型 。 前 一 种 一 般 对 应 组 合 电路 ， 如 上 面 给 出 的 加 法 器 的 例子 ， 后 
一 种 一 般 对 应 时 序 电 路 。 对 于 时 序 电路 ， 敏 感 信号 通常 是 时 钟 信号 ， 
Verilog HDL 提 供 了 posedge、negedge 两 个 关键 字 来 描述 时 钟 信号 。 
posedge 表 示 以 时 钟 信号 的 上 升 沿 作为 触发 条 件 ，negedge 表 示 以 时 钟 


言 号 的 下 降 沿 作为 触发 条 件 。 还 是 以 32 位 加 法 器 为 例 ， 可 以 为 其 添加 
一 个 时 钟 同步 信号 ， 如 下 。 


module add32(input wire clk, // 增 加 了 一 个 时 钟 输入 信号 
input wire[31:0] ini, 
input wire[31:0] in2, 
output reg[31:0] out); 


always @ (posedge clk) // 在 时 钟 信号 的 上 升 沿 会 触发 
always 中 的 语句 
begin 
out = in1 + in2; 


end 


endmodule 


在 时 钟 信号 的 上 升 沿 ， 才 会 进行 加 法 运算 ， 这 一 点 与 前 面 的 加 法 
器 不 同 ， 也 就 是 当 被 加 数 in1、 加 数 in2 变 化 时 ， 并 不 会 立即 改变 输出 
out， 而 是 要 等 待 时 钟 信号 的 上 升 沿 。 


2 。initiaI 过 程 语句 


initial 过 程 语 句 的 格式 如 图 2-11 所 示 。 


initial 
begin 


// 语句 序列 


end 


图 2-11 initial 过 程 语 句 的 格式 


initial 过 程 语 句 不 带 触 发 条 件 ， 并 且 其 中 的 语句 序列 只 执行 一 次 。 
initial 过 程 语 句 通 常用 于 仿真 模块 中 对 激励 向 量 的 描述 ， 或 用 于 给 育 存 
器 赋 初 值 ， 它 是 面向 模拟 仿真 的 过 程 语 句 ， 通 常 不 能 被 综合 。 如 下 是 
initial 过 程 语句 的 一 个 例子 ， 用 于 给 存储 器 mem 赋 初 值 。 
initial 
begin 

for(addr = 0; addr < size; addr = addr+1) // for 是 一 种 循环 语 
句 ， 下 文 会 介绍 

mem[addr] = 0; 


end 


2.6.2 ”赋值 语句 


赋值 语句 有 两 种 : 持续 赋值 语句 、 过 程 赋值 语句 。 
1. 持续 赋值 语句 


assign 为 持续 赋值 语句 ， 主 要 用 于 对 wire 型 变量 的 赋值 。 如 上 文中 
加 法 器 的 例子 。 


2. 过 程 赋值 语句 


在 always、initial 过 程 中 的 赋值 语句 称 为 过 程 赋值 语句 ， 多 用 于 对 
reg 型 变量 进行 赋值 ， 分 为 非 阻 塞 赋值 和 阻塞 赋值 两 种 方式 。 


(1) 非 阻塞 赋值 (Non-Blocking) 
赋值 符号 为 "<=”， 例 如 。 
b <= a 


非 阻 塞 赋值 在 整个 过 程 语句 结束 时 才 会 完成 赋值 操作 ， 即 b 的 值 并 
不 是 立刻 改变 的 。 


(2) 阻塞 赋值 (Blocking) 
赋值 符号 为 “=”， 例 如 。 
b = a 


阻塞 赋值 在 该 语句 结束 时 就 立即 完成 央 值 操作 ， 即 b 的 值 在 这 条 语 
句 结束 后 立刻 改变 。 如 果 在 一 个 块 语 句 中 ， 有 多 条 阻塞 赋值 语句 ， 那 
么 在 前 面 的 赋值 语句 没有 完成 之 前 ， 后 面 的 语句 就 不 能 被 执行 ， 仿 佛 
被 阻塞 了 一 样 ， 因 此 称 为 阻塞 赋值 方式 。 


在 always 过 程 块 中 ， 阻 塞 赋值 可 以 理解 为 赋值 语句 是 顺序 执行 
的 ， 而 非 阻塞 赋值 可 以 理解 为 赋值 语句 是 并 发 执行 的 。 如 图 2-12 所 


示 。 在 一 个 过 程 块 中 ， 阻 塞 式 赋值 与 非 阻 塞 式 赋值 只 能 使 用 其 中 一 


always @ ( *** X; 
begin 


a<=atl; ee eo o ner 
E 


如 果 执 行 前 a 的 值 为 0， 那 么 执行 上 面 
的 过 程 语句 后 ，a 为 1，b 为 1 


always @ (*** ); 

begin 
a=atl; A a peace 
b=atl: CI 由 上 到 下 讨 算 


“or... 


如 果 执 行 前 a 的 值 为 0， 那 么 执行 上 面 
的 过 程 语句 后 ，a 为 1，b 为 2 


非 阻塞 赋值 


阻塞 赋值 


图 2-12 ” 非 阻 塞 赋值 与 阻塞 赋值 


条 件 语 句 


条 件 语 句 有 if-else、case 两 种 ， 应 放 在 always 块 内 。 分 别 介绍 如 


2.6.3 


1. if-elseiB4) 


if-else 语 句 的 格式 有 如 下 三 种 。 


(1) if( 表 达 式 ) 语句 序列 1; // 非 完整 性 IF 
语句 
(2) if( 表 达 式 ) 语句 序列 1; // 二 重 选择 的 


else 语句 序列 2 ; 


(3) if( 表 达 式 1) 语句 序列 1; // 多 重 选 择 的 


IF 语句 


else if( 表 达 式 2) 语句 序列 2 ; 
else if( 表 达 式 3) 语句 序列 3 ; 
else if (RAN) 语句 序列 n ; 
else 语句 序列 n+1; 


上 述 格 式 中 的 “表达 式 ” 一 般 为 逻辑 表达 式 或 关系 表达 式 ， 也 可 能 
是 1 位 的 变量 。 系 统 对 表达 式 的 值 进行 判断 ， 如 果 为 0、X、Z， 则 按 
“ 假 ” 处 理 ， 如 果 为 1， 则 按 “ 真 处理。 语句 序列 可 以 是 单 句 ， 也 可 以 是 
多 句 ， 多 句 时 需 使 用 begin-end 块 语句 括 起 来 。 


还 是 以 32 位 加 法 器 为 例 ， 为 其 添加 一 个 复位 信号 rst， 如 果 rst 为 高 
电 平 ， 那 么 复位 信号 有 效 ， 输 出 out 为 0， 反 之 ， 复 位 信号 无 效 ， 输 出 
out 为 两 个 输入 信号 之 和 。 


module add32(input wire rst, // 增加 了 一 个 复位 信号 
input wire[31:0] ini, 
input wire[31:0] in2, 


output reg[31:0] out); 


always @ (*) 
begin 
if(rst == 1'b1) 
out <= 32'h0; // 如 果 复 位 信号 有 效 ， 那 么 输出 out 为 9 
elise 
out <= ini + in2; // 反之 ， 输 出 out 为 两 个 输入 信号 之 和 


endmodule 


2: case 语 句 


相对 于 if-else 语 句 只 有 两 个 分 支 而 言 ，case 语 句 是 一 种 多 分 支 语 
句 ， 所 以 case 语 句 多 用 于 多 条 件 译 码 电路 ， 如 译 码 器 、 数 据 选 择 器 、 
状态 机 六 微 处 理 器 的 指令 译 码 等 。 其 格式 如 下 。 


case (敏感 表达 式 ) 
(61: 语句 序列 1， 
值 2: 语句 序列 2 ， 
{An: 语句 序列 n ， 
default: 语句 序列 n+1; 


endcase 


当 敏感 表达 式 的 值 等 于 “ 值 1* 时 ， 执 行 语句 序列 1， 当 等 于 “ 值 2” 
时 ,执行 语句 序列 2; 依次 类 推 。 如 果 敏感 表达 式 的 值 与 上 面 列 出 的 值 
都 不 符 ， 那 么 执行 default 后 面 的 语句 序列 。 如 下 代码 是 一 个 简单 的 运 
算 单 元 ， 可 执行 加 法 或 减法 运算 ， 如 果 输 入 变量 type 的 值 为 1， 那 么 执 
行 加 法 运算 ， 如 果 type 的 值 为 0， 那 么 执行 减法 运算 。 


module add_sub32(input wire type, // type 决 定 运 算 类 型 
input wire[31:0] ini, 
input wire[31:0] in2, 


output reg[31:0] out); 


always @ (*) 


begin 

case(type) 
1'b1 : out <= in1 + 202 // type 为 1， 执 行 加 法 运算 
O s out <= ini =- 1in2: // type 为 90， 执行 减法 运算 


default : out <= 32'h®; 
endcase 


end 


endmodule 


case 语 句 中 ， 敏 感 表 达 式 与 值 1~n 之 间 的 比较 是 一 种 全 等 比较 ， 
必须 保证 两 者 的 对 应 位 全 等 。casez、casex 语 句 是 case 语 句 的 两 种 扩 
展 。 


e 在 casez 语 句 中 ， 如 果 比 较 的 双方 某 些 位 的 值 为 高 阻 Z， 那 么 
对 这 些 位 的 比较 结果 就 不 予 考 虑 ， 只 需 考 虑 其 他 位 的 比较 结 
果 。 

e 在 casex 语 句 中 ， 如 果 比 较 的 双方 某 些 位 的 值 为 Zz 或 Xx， 那么 
对 这 些 位 的 比较 结果 就 不 予 考虑 ， 只 需 考 虑 其 他 位 的 比较 结 
果 。 


此 外 ， 还 有 一 种 表示 X 或 Zz 的 方式 ， 即 用 表示 无 天 值 的 符号 “?” 来 
表示 ， 例 如 。 


case(a) 


2'b1x : out <= 1; // 只 有 a 等 于 2'b1lx 时 ，out 才 等 于 1 


casez(a) 


2'b1x : out <= 1; 


casex(a) 
2'b1x : out <= 1; 
ara 


case(a) 
2'b1? : out <= 1; 
十 二 


//a 等 于 2'b1x、2'b1z 时 ，out 等 于 1 


//a 等 于 2'b10、2'b11、2'b1x、2'b1z 时 ，out 等 


//a 等 于 2'b10、2'b11、2'b1x、2'b1z 时 ，out 等 


2.6.4 1514154) 


Verilog HDL 中 存在 四 种 类 型 的 循环 语句 : for. forever, repeat, 
while， 用 来 控制 语句 的 执行 次 数 ， 分 别 介 绍 如 下 。 


1。for 语 句 


for 语 句 的 格式 如 下 。 这 与 C 语 言 是 相似 的 。 


for (循环 变量 赋 初 值 ， 循 环 结束 条 件 ， 修改 循环 变量 ) 


执行 语句 序列 ; 


一 个 使 用 for 语 句 实 现 7 人 表决 器 的 例子 如 下 。 通 过 for 循 环 统 计 赞 
成 的 人 数 ， 若 超过 4 人 (44) 赞成 则 通过 ， 其 中 vote[7:1] 表 示 7 个 人 


ARR, votei], RNBiTARNERMR, RZERNS, 
pass 是 输出 ， 超 过 4 个 人 赞成 ，pass 为 1， 反 之 为 0。 


2 。forever 语 句 


forever 语 句 的 格式 如 下 。 


forever 循 环 语句 连续 不 断 地 执行 其 中 的 语句 序列 ， 常 用 来 产生 有 周 
期 性 的 波形 。 在 2.8 节 编写 仿真 用 的 Test Bench 文 件 时 ， 会 给 出 forever 
语句 的 例子 。 


3. repeat 


repeat 语 句 的 格式 如 下 。 


4. while 
while 语 句 的 格式 如 下 。 


while 语 句 在 执行 时 ， 首 先 判 断 循 环 执行 条 件 表达 式 是 否 为 真 ， 若 
为 真 ， 则 执行 其 中 的 语句 序列 ， 然 后 再 次 判断 循环 执行 条 件 表达 式 是 
否 为 真 ， 若 为 真 ， 则 再 次 执行 其 中 的 语句 序列 ， 如 此 反复 ， 直 到 循环 
执行 条 件 表达 式 不 为 真 为 止 。 


265 ”编译 指示 语句 


Verilog HDL 和 C 语 言 一 样 提供 了 编译 指示 功能 ， 人 允许 在 程序 中 使 
用 编译 指示 (Compiler Directives) 语句 ， 在 编译 时 ， 通 单 先 对 这 些 指 
示 语 名 进行 预 处 理 ， 然 后 再 将 预 处 理 的 结果 和 源 程序 一 起 进行 编译 。 


编译 指示 语句 以 “” 开 始 ， 以 区 别 其 他 语句 。 常 用 的 编译 指示 语句 
有 : `define、`include、`ifdef、`else、`endif， 分 别 介 绍 如 下 。 


1. RBH define 


"define 可 以 用 一 个 简单 的 名 字 或 有 意义 的 标识 (也 称 为 宏 名 ) R 
替 一 个 复杂 的 名 字 或 变量 ， 其 格式 如 下 。 


"define 2% 变量 或 名 字 

例如 : 一 般 在 时 序 电 路 中 会 有 一 个 复位 信号 ， 当 该 复位 信号 为 高 
电 平 时 表示 复位 信号 有 效 ， 当 该 复位 信号 为 低 电 平 时 ， 表 示 复 位 信号 
无 效 。 分 别 执行 不 同 的 代码 ， 如 下 。 
always @ (clk) 


begin 


if(rst == 1'b1) 


一 种 更 为 友好 的 书写 方式 ， 是 使 用 安定 义 ， 如 下 。 


2。'`incIude 语 句 


`include 是 文件 包含 语句 ， 它 可 将 一 个 文件 全 部 包含 到 另 一 个 文件 
中 ， 使 用 格式 如 下 。 


在 OpenMIPS 处 理 器 的 实现 过 程 中 ， 我 们 定义 了 很 多 宏 ， 这 些 宏 都 
集中 在 文件 defines.v 中 ， 如 果 某 一 程序 需要 使 用 其 中 的 宏 定 义 ， 就 可 
以 在 程序 文件 的 开始 使 用 `include 语 句 将 defines.v 文 件 包 含 进来 即 可 ， 
如 下 。 


“include "defines.v" 
3. RATES ifdef, “else, ‘endif 


条 件 编译 语句 `ifdef、`else、`endif 可 以 指定 仅 对 程序 中 的 部 分 内 容 
进行 编译 ， 有 两 种 使 用 形式 。 


第 一 种 使 用 形式 如 下 。 当 指定 的 宏 在 程序 中 已 定义 ， 那 么 其 中 的 
语句 序列 参与 源 文件 的 编译 ， 否 则 ， 其 中 的 语句 序列 不 参与 源 文件 的 
编译 。 


`ifdef 2% 


语句 序列 


“endif 


第 二 种 使 用 形式 如 下 。 当 指定 的 宏 在 程序 中 已 定义 ， 那 么 其 中 的 
语句 序列 1 参与 源 文 件 的 编译 ， 否 则 ， 其 中 的 语句 序列 2 参与 源 文 件 的 
编译 。 


`ifdef 2% 


语句 序列 1 


“else 
语句 序列 2 


“endif 


2.6.6 行为 语句 的 可 综合 性 


前 面 几 小 节 介 绍 了 Verilog HDL 中 的 多 种 行为 语句 ， 包 括 过 程 语 
句 、 赋 值 语 句 、 条 件 语 句 、 循 环 语句 、 编 译 指示 语句 ， 所 有 的 语句 都 
能 在 仿真 中 使 用 ， 但 是 有 些 语句 是 不 可 综合 的 ， 也 融 是 说 综合 器 无 法 
将 这 些 语句 转变 为 对 应 的 硬件 电路 。Verilog HDL 行为 语句 可 综合 性 的 
情况 如 表 2-4 所 示 。 


表 2-4 Verilog HDL 行为 语句 的 可 综合 性 


类 别 语句 可 综合 性 
initial 
过 程 语句 | 
持续 赋值 assign 
赋值 语句 | 
run ere 


| 


[ese | 


A 


forever 


循环 语句 
=æ 
COS AA 


“define 


编译 指示 语句 include 


| 
27 ”电路 设计 举例 


本 节 将 设计 一 个 简化 的 处 理 器 取 指 令 电 路 ， 通 过 这 个 例子 体会 
Verilog HDL 的 使 用 。 


处 理 器 内 部 一 般 有 一 个 PC 寄存 器 ， 其 中 存储 指令 地 址 ， 正 常 运行 
过 程 中 ，PC 的 值 会 随时 间 增 加 ， 同 时 从 指令 存储 器 中 取出 对 应 地 址 的 
虽 令 。 所 以 ， 本 节 实 现 的 处 理 器 取 指 令 电 路 ， 包 含 两 部 分 : PC 模块 、 
目 令 存储 器 。 


1. PC 模块 的 设计 与 实现 


PC 模块 的 功能 就 是 给 出 取 指 令 地 址 ， 同 时 每 个 时 钟 周期 取 指 令 地 
址 递增 。 其 接口 设计 如 图 2-13 所 示 。 采 用 左边 是 输入 接口 、 右 边 是 输 


出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 作 用 描述 如 表 2-5 所 示 。 


图 2-13 ”PC 模块 的 接口 


表 2-5 PC 模块 的 接口 描述 


接口 名 宽度 (bit) 输入 /输出 
输入 VAS 


TA 钟 信号 
Fe e o o o eee 
Je [i | 输 ERST 

此 处 定义 指令 地 址 pc 的 宽度 为 6，PC 模 块 的 主要 代码 如 下 ， 可 以 
参考 本 书 光 盘 Code\Chapter2 目 录 下 的 pc_reg.v 文 件 。 


module pc_reg( 


input wire clk, 


input wire rst, 


output reg[5:0] pe, 


output reg ce 


); 


always @ (posedge clk) begin  // 在 时 钟 信号 上 升 沿 触 发 
if (rst == 1'b1) begin 


ce <= 1'b0; // 复 位 信号 有 效 的 时 候 ， 指 令 人 存储 器 使 能 信号 无 效 
end else begin 

ce <= 1'b1; // 复 位 信号 无 效 的 时 候 ， 指 令 存储 器 使 能 信号 有 效 
end 

end 


always @ (posedge clk) begin // 在 时 钟 信号 上 升 沿 触 发 
if (ce == 1'b0) begin 
pc <= 6'h00; // 指 令 存储 器 使 能 信号 无 效 的 时 候 ，pc 保 持 为 9 
end else begin 
pe <= pc + 1'b1;  ”// 指 令 存储 器 使 能 信号 有 效 的 时 候 ，pc 在 每 个 时 钟 加 1 
end 


end 


endmodule 


2. 指令 存储 器 ROM 的 设计 与 实现 


指令 存储 器 ROM 的 作用 是 存储 指令 ， 并 依据 输入 的 地 址 ， 给 出 对 
应 地 址 的 指令 。 其 接口 如 图 2-14 所 示 ， 还 是 采用 左边 是 输入 接口 、 右 
边 是 输出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 朱 述 如 表 2-6 所 示 。 


ROM 
addr inst 


ce 


图 2-14 ”ROM 模块 的 接口 


表 2-6 ”ROM 模块 的 接口 描述 


此 处 定义 指令 的 宽度 为 32， 指 令 存储 器 ROM 的 主要 代码 如 下 ， 可 
以 参考 在 本 书 光盘 Code\Chapter2 目 录 下 的 rom.v 文 件 。 


endmodule 


其 中 使 用 了 一 个 二 维 向 量 定义 存储 器 ， 深 度 是 64， 每 个 元 素 的 宽 
度 是 32， 这 也 是 使 用 6 位 地 址 即 可 的 原因 。 


3. 顶层 文件 


先 介绍 元 件 例 化 的 知识 ， 在 一 个 复杂 电路 的 实现 过 程 中 ， 可 以 将 
其 分 割 成 多 个 功能 单元 分 别 实现 ， 然 后 在 一 个 顶层 文件 中 通过 调用 各 
个 功能 单元 ， 将 其 按照 一 定 方式 连接 在 一 起 ， 从 而 实现 最 终 电路 。 其 
中 调用 功能 单元 的 过 程 就 称 为 元 件 例 化 。 元 件 例 化 的 格式 如 图 2-15 所 
示 。 


< 模块 名 > < 实例 名 >( 


< 相连 的 端口 名 >( 相 连 的 信号 名 
.< 相连 的 端口 名 >( 相 连 的 信号 名 ) 


.. eo... 


图 2-15 ”元件 例 化 的 格式 


经 过 上 面 两 步 ， 我 们 分 别 实现 了 PC 模块 、 指 令 存储 器 ROM， 现 在 
可 以 编写 顶层 文件 将 两 者 连接 起 来 。 连 接 方式 如 图 2-16 所 示 。 


inst_fetch 


PC ROM 
rst rst pe > addr inst inst_o 


clk clk ce HS ce 


图 2-16 ”顶层 文件 inst_fetch 


PC 模块 的 输出 pc 连接 到 指令 存储 器 ROM 的 地 址 接口 addr，PC 模 块 
输出 的 使 能 信号 ce 连接 到 ROM 的 使 能 信号 接口 ce。 顶层 模块 对 应 的 模 
块 名 为 inst_fetch， 有 三 个 接口 ， 接 口 描述 如 表 2-7 所 示 。 


表 2-7 ”顶层 文件 inst_fetch 模 块 的 接口 描述 


Pst | 输入 


An I 


inst_fetch 模 块 的 主要 代码 如 下 ， 其 中 例 化 了 PC 模块 、 指 令 人 存储 器 
ROM。 可 以 参考 本 书 光 盘 Code\Chapter2 目 录 下 的 inst_fetch.v 文 件 。 


module inst_fetch( 
input wire clk, 
input wire rst, 
output wire[31:0] inst_o 


); 


wire[5:0] pc; 


wire rom_ce; 


/VPC 模块 的 例 化 
pc_reg pc_regO(.clk(clk), .rst(rst), 


.pc(pc), .ce(rom_ce)); 


// 指 令 存储 器 ROM 的 例 化 


rom romo( .ce(rom ce), .addr (pc), .inst(inst_o)); 


endmodule 


PC 模块 的 输出 pc、ROM 模 块 的 输入 addr 都 连接 到 变量 pc， 所 以 两 
者 连接 在 一 起 ; PC 模块 的 输出 ce、ROM 模 块 的 输入 ce 都 连接 到 
rom_ce， 所 以 两 者 连接 在 一 起 。 这 样 就 实现 了 图 2-16 所 示 的 连接 关 
系 。 


28 ”仿真 


2.7 节 实现 了 一 个 简化 的 处 理 器 取 指 电路 ， 需 要 通过 仿真 以 验证 其 
功能 是 否 正确 ， 直 观 的 仿真 思路 就 是 : 给 出 一 个 时 钟 信号 ， 上 述 电 路 
会 在 每 个 时 钟 信号 上 升 沿 将 取 指 地 址 加 1， 同 时 从 指令 存储 器 中 取出 一 
条 指令 ， 观 察 取 指 地 址 是 否 依次 递增 ， 同 时 观察 取出 的 指令 是 否 是 存 
储 器 中 取 指 地 址 对 应 的 指令 ， 如 果 都 符合 ， 那 么 上 述 取 指 电路 就 实现 
正确 。 此 处 涉及 两 个 问题 。 


(1) 如 何在 指令 存储 器 中 存储 指令 ， 也 就 是 指令 存储 器 初始 化 间 


题 。 
(2) 如 何 给 出 时 钟 信 号 ? 


本 贡 将 分 别 解 任 上 述 问 题 ， 在 此 基础 上 ， 使 用 ModelSim 进 行 仿 


\ 
A 
O 


2.8.1 ”系统 国 数 


初始 化 存储 器 有 两 种 方法 ， 一 种 是 对 存储 器 中 每 个 存储 单元 依次 
给 出 初 值 ， 如 下 。 


rom[0] = 32'h00000000; // 存 储 器 rom 的 第 9 个 元 素 初 始 化 为 0x000000090 
rom[1] = 32'ho1010101; // 存 储 器 rom 的 第 1 个 元 素 初始 化 为 0x01010101 
rom[2] = 32'h02020202; // 存 储 器 rom 的 第 2 个 元 素 初始 化 为 0x02020202 


rom[3] = 32'h03030303;  ”// 存 储 器 rom 的 第 3 个 元 素 初 始 化 为 0X03030303 


另 一 种 方法 是 使 用 系统 函数 $readmemh， 这 样 更 加 方便 ， 但 是 后 
者 只 能 用 于 仿真 中 。 


除了 $readmemh 外 ， 在 Verilog HDL 中 还 定义 了 很 多 系统 函数 ， 比 
如 显示 当前 仿真 时 间 的 函数 $9time、 显 示 信 号 值 的 函数 $display、 暂 停 
仿真 过 程 的 国 数 $stop、 结 束 仿真 过 程 的 国 数 $finish 等 。 本 书 主要 用 到 
了 $stop、$readmemh 这 两 个 系统 图 数 。 


1. $stop 


$stop 用 于 对 仿真 过 程 进行 控制 ， 暂 停 仿真 ， 其 使 用 格式 如 下 。 


$stop(); // 使 用 格式 一 ， 不 带 参 数 
$stop(n); // 使 用 格式 二 ， 带 参数 n，n 可 以 等 于 909、1、2 等 值 ， 含 义 如 
ies 


// 90: 不 输出 任何 信息 ; 
// 1: 给 出 仿真 时 间 和 位 置 
// 2: 给 出 仿真 时 间 和 位 置 ， 还 有 其 他 一 些 运 行 统计 数据 


当 仿真 程序 执行 到 $stop 语 句 时 ， 将 暂时 停止 仿真 ， 此 时 设计 者 可 
以 输入 命令 ， 对 仿真 器 进行 交互 控制 。 


2. $readmemh 


$Sreadmemh A R A FRR F, AER EM bab FAIRE HE 
并 放 入 存储 器 中 。 使 用 格式 如 下 。 


$readmemh(" 数 据 文件 名 "， 存储 对 象 ) ; 


将 第 1 个 参数 指定 文件 的 数据 谈 入 第 2 个 参数 指定 的 存储 器 中 。 例 
如 。 


reg[31:0] rom[63:0]; 


initial $readmemh ( "rom.data", rom ); // 读 入 文件 rom.data 的 数据 


到 rom 中 


此 处 对 数据 文件 的 格式 有 一 定 要 求 ， 要 求 使 用 十 六 进 制 记录 数 
据 ， 且 每 一 行 记 录 一 个 地 址 的 数据 。 例 如 : rom.data 的 内 容 如 下 ， 每 一 
行 是 一 个 32 位 的 数据 。 


00000000 
01010101 
02020202 
03030303 


使 用 $readmemh ( "rom.data", rom ) 国 数 后 ，rom 的 内 容 就 会 初始 化 
为 如 下 。 rom[0]: 32'h00000000; /存储 器 rom 的 第 0 个 元 素 初 始 化 为 
0x00000000 


rom[1]: 32'h01010101;  // 存 储 器 rom 的 第 1 个 元 素 初 始 化 为 Oox01010101 
rom[2]: 32'h02020202; ”// 存 储 器 rom 的 第 2 个 元 素 初 始 化 为 0xX02020202 
rom[3]: 32'h03030303; ”// 存 储 器 rom 的 第 3 个 元 素 初 始 化 为 0xX03030303 


回 到 本 节 最 开始 提出 的 两 个 问题 ， 现 在 可 以 回答 第 一 个 问题 了 ， 
为 了 实现 对 指令 存储 器 的 初始 化 ， 只 需要 创建 一 个 数据 文件 ， 其 内 容 
如 上 面 的 rom.data 所 示 ， 然 后 在 指令 存储 器 romv 中 ， 增 加 代码 
$readmemh ( "rom.data", rom ) 即 可 。 完 整 代 码 可 以 参考 本 书 光盘 
Code\Chapter2 目 录 下 的 rom.v 文 件 。 


2.8.2 Test Bench 


现在 回答 本 节 最 开始 提出 的 第 二 个 问题 ， 通 过 创建 Test Bench 文 件 
以 给 出 时 钟 信 号 。 


Test Bench 为 测试 或 仿真 一 个 Verilog HDL 程序 搭建 了 一 个 平台 ， 
我 们 给 被 测试 的 模块 施加 激励 信号 ， 通 过 观察 被 测试 模块 的 输出 响 
应 ， 从 而 判断 其 逻辑 功能 实现 得 正确 与 否 。 如 图 2-17 所 示 。 


测试 平台 Test Bench 


A 输入 激励 信号 ， 一 般 是 reg 类 型 
> 
—_— > 
0519 $ 
测试 模块 待 测试 模块 


F . 6 
输出 显示 一 一 一 一 
€ \ 


Y 输出 显示 信号 ，wire 类 型 


图 2-17 Test Bench 示 意图 


Test Bench 的 结构 如 图 2-18 所 示 ， 与 2.4 节 介绍 的 Verilog HDL 模块 
的 结构 没有 根本 区 别 ， 但 有 自身 的 一 些 特点 。 


。 Test Bench 只 有 模块 名 ， 没 有 端口 列表 ; 激励 信号 (输入 到 待 
测试 模块 的 信号 ) 必须 定义 为 reg 类 型 ， 以 保持 信号 值 ; Má 
测试 模块 输出 的 信号 (用 户 观 察 的 信号 ) 必须 定义 为 wire 类 
型 

。 在 Test Bench 中 要 调用 被 测试 模块 ， 也 就 是 元 件 例 化 。 

e Test Bench 中 一 般 会 使 用 initial、always 过 程 块 来 定义 、 描 述 
激励 信号 。 


module <Test Bench 名 >; 
< 数据 类 型 说 明 > /激励 信号 使 用 reg 类 型 ， 显 示 信 号 使 用 wire 类 型 
< 激励 向 量 定义 > /always、initial 过 程 块 等 
< 待 测试 模块 例 化 > 


endmodule 


图 2-18 Test Bench 的 一 般 结 构 


为 简单 取 指 令 电 路 设计 的 Test Bench 如 下 ， 完 整 代码 位 于 本 书 光 盘 
Code\Chapter2 目 录 下 的 inst_fetch_tb.v 文 件 。 


inst_fetch inst_fetcho( 
.Clk(CLOCK), 

.rst(rst), 
.inst_o(inst) 


); 


endmodule 


2.83 Modelsim 仿 真 

指令 存储 器 初始 化 问题 解决 了 、 时 钟 信 号 也 给 出 了 ， 现 在 可 以 使 
用 ModelSim 进 行 仿真 了 。 

1。 建 立 ModelSim 工 程 


打开 ModelSim， 选 择 File->New->Project， 出 现 新 建 工 程 对 话 框 ， 
其 中 填写 工程 名 ， 选 择 保存 目录 ， 注 意 保存 目录 中 不 要 有 中 文 ， 如 图 
2-19 所 示 。 


IFA! Create Project 


Project Name 
inst_fetch 


Project Location 
F: /VerilogHDL/OpenMIPS/Chapter2 Browse... 


Default Library Name 
work 


Copy Settings From 
odeltech_10.1a/modelsim.ini Browse... 
(* Copy Library Mappings © Reference Library Mappings 


_ Ok | cancel | 
图 2-19 新 建 ModelSim 工 程 对 话 框 


单 击 OK 按钮 后 ， 会 出 现 图 2-20 所 示 的 界面 ， 这 里 单 击 Add 
Existing File， 也 就 是 添加 已 有 文件 ， 出 现 图 2-21 所 示 的 添加 文件 对 话 
框 。 


fu] Add items to the Project EN 
Click on the icon to add items of that type: 


O |] 


Create New File Add Existing File 


一 


[Y] Add file to Project 


M Ca File Name == 


Create Simulation Create New Folder 


Add file as type Folder 


| [Top Level vi 
(* Reference from current location © Copy to project directory 
Close OK Cancel 


图 2-20 ”选择 添加 已 有 文件 图 2-21 添加 文件 对 话 框 


单 击 Browse 按 钮 ， 出 现 选 择 文件 对 话 框 ， 找 到 本 书 光 盘 的 
Code\Chapter2 目 录 ， 添 加 其 中 所 有 的 .v 文 件 ， 如 图 2-22 所 示 。 


Select files to add to project 


SHIEH CO: |C Chapter? 


HS Ww: “inst_fetch. v" “inst_fetch_tb.v" “pea v| FIFO ] 
文件 类 型 T): HDL Files (Gk. v,*. vl, *. vhd, *. vhdl, *. vh | 取消 


图 2-22 添加 Code\Chapter2 目 录 下 的 所 有 .v 文 件 


选择 要 添加 的 文件 后 ， 单 击 “ 打 开 ” 按 钮 ， 即 完成 添加 ， 此 时 显示 
图 2-23 所 示 界 面 ， 在 其 中 选中 copy to project directory， 这 样 就 会 将 刚 
才 选 中 的 文件 复制 到 新 的 工程 目录 下 。 


[Y] Add file to Project 


File Name 
E: /VerilogHDL/OpenMIPS/Chapter2/inst_fetch.v Browse... 


Add file as type Folder 


| | Fr op Level 可 | 


C Reference from current location (* Copy to project directory 


OK Cancel 


图 2-23 ”选择 Copy to project directory 


alcala SE Modelo tints ET an ern 
态 ， 其 中 问号 表示 对 应 文件 没有 编译 。 任 意 选 中 一 个 文件 ， 用 鼠标 右 
键 单 击 ， 在 弹出 菜单 中 选择 Compile->Compile All， 即 开始 编译 所 有 文 
件 ， 如 图 2-24 所 示 。 稍 等 几 秒 钟 就 编译 结束 了 。 编 译 结束 后 ， 所 有 的 
文件 状态 都 应 该 是 一 个 绿色 的 “V”。 


amo Project - F:/VerilogHDL/OpenMIPS/Chapter 2/inst_fetch 


3 


Verilog 


ER | 


Compile Selected 
fa) pcregv Add to Project > Compile Al 
Remove from Project Compile Out-of-Date 
Close Project Compile Order... 
Update Compile Report... 


Compile Summary... 
Properties... 


Project Settings... 


Compile Properties... 


图 2-24 ”编译 所 有 文件 


2. 开始 仿真 


切换 到 Library 这 个 Tab ， 然 后 展开 work 目 录 ， 在 inst_fetch tb 文件 
上 单 击 右键 ， 在 弹出 菜单 中 选择 Simulate， 如 图 2-25 所 示 。 


| Library 


st fern ET 
+} ih vital2000 Simulate without Optimization 
Simulate with full Optimization 
Simulate with Coverage 
Edit 


Recompile 
Optimize 


Update 


Create Wave 


图 2-25 ”在 inst_fetch_tb 上 单 击 右键 ， 选 择 Simulate 


此 时 会 增加 一 个 Tab ， 名 称 为 sim， 展 开 其 中 的 inst_fetch_ bts, 
选择 inst_fetch0， 会 在 Objects 窗 口中 显示 inst_ on Alas, Y 
图 2-26 所 示 ， 如 果 没 有 出 现 Objects 窗 口 ， 可 以 通过 菜单 View->Objects 
调 出 该 窗口 。 


= REx] La Objects — cs: E A xl 
Instance WiName ivalue |Kind [Mode | 
ZH inst_fetch_tb E rst Stx In 
BF inst_fetcho # rom_ce stx Internal 
++ Bf pc_regd 4 pc XXXXXX Internal 


+) gf romo 4. inst_o XXXXXXXXXXXXXXXX. .. 
@ #INITIAL#9 # dk st 


图 2-26 ”在 Objects 窗 口中 显示 选中 模块 的 所 有 信号 


选择 Objects 窗 口中 的 所 有 信号 ， 然 后 单 击 右 键 ， 在 弹出 菜单 中 选 
择 Add to ->Wave->Selected Signals， 如 图 2-27 所 示 ， 将 所 有 信号 都 添加 
到 Wave 窗 口中 。 这 些 都 是 要 观察 的 信号 。 添 加 要 观察 信号 后 的 Wave 窗 
口 如 图 2-28 所 示 。 


[lx] pa] Wave -Default 一 


图 2-27 ”选择 要 观察 的 信号 图 2-28 ”添加 要 观察 信号 后 的 Wave 窗口 


单 击 工具 栏 中 的 Run-All 按 钮 ， 就 可 开始 仿真 ， 如 图 2-29 所 示 ， 仿 
真 结果 如 图 2-30 所 示 。 从 仿真 结果 可 知 ， 处 理 器 取 指 令 电路 实现 正 
确 。 


O 时 钟 信号 每 隔 10ns 翻 转 一 次 ， 一 个 时 钟 周 期 是 20ns， 所 以 频率 是 530MHz | 


(2) 在 195ns 的 时 候 复位 信号 转 为 无 效 人 


N 点 击 Run-All， 开 始 仿真 


G) 指令 存储 器 使 能 信号 ce 有 效 ， 开 始 取 指 V 


\ GS) inst_o 就 是 指令 存 人 
| 器 ROM 中 地 址 为 pe 处 对 
(a) 取 指 地 址 依次 递增 | 应 的 指令 


图 2-29 ” 单 击 Run-All 按 钮 开始 仿真 图 2-30 ”仿真 结 


29 ”本 章 小 结 


本 章 花 了 比较 大 的 篇 幅 介 绍 了 可 编程 逻辑 器 件 的 基本 知识 ， 以 及 
基于 可 编程 逻辑 器 件 的 数字 系统 设计 流程 ， 包 括 设 计 输 入 、 综 合 、 
局 布线 、 下 载 、 仿 真 等 几 步 ， 这 与 传统 的 数字 系统 设计 流程 还 是 有 很 
大 不 同 的 。 然 后 介绍 了 Verilog HDL 这 样 一 种 硬件 编程 语言 ， 这 也 是 将 
要 用 来 实现 OpenMIPS 处 理 器 的 语言 。 在 此 基础 上 ， 设 计 实 现 了 一 个 简 
化 的 处 理 器 取 指 令 电路 ， 并 使 用 ModelSim 仿 真 验证 该 电路 实现 的 正确 
性 。 在 后 期 教学 版 OpenMIPS 的 设计 实现 过 程 中 ， 主 要 也 是 使 用 
ModelSim 仿 真 验 证 ， 步 骤 都 是 一 样 的 。 


从 第 3 章 开 始 ， 就 正式 进入 OpenMIPS 处 理 器 的 设计 实现 阶段 了 。 


第 3 章 
第 4 章 
第 5 章 
第 6 章 
第 7 章 
第 8 章 


第 9 章 


第 二 篇 ”基础 篇 


教学 版 OpenMIPS 处 理 器 蓝图 
第 一 条 指令 ori 的 实现 

逻辑 、 移 位 操作 与 空 指令 的 实现 
移动 操作 指令 的 实现 
算术 操作 指令 的 实现 

转移 指令 的 实现 

加 载 存 储 指令 的 实现 


第 10 章 ” 协 处 理 器 访问 指令 的 实现 
第 11 章 ”异常 相关 指令 的 实现 


第 3 章 ”教学 版 OpenMIPS 处 理 器 
KE 


从 本 章 开 始 将 一 步 一 步 地 实现 教学 版 OpenMIPS 处 理 器 。 本 章 给 出 
了 教学 版 OpenMIPS 的 系统 蓝图 ， 首 先 介 绍 了 系统 的 设计 目标 ， 其 中 详 
细 说 明了 OpenMIPS 处理 器 计划 实现 的 5 级 流水 线 。3.2 节 给 出 了 
OpenMIPS 处 理 器 的 接口 示意 图 ， 以 及 各 个 接口 的 作用 。3.3 节 简单 解 
释 了 各 个 源 代 码 文件 的 作用 ， 最 后 描述 了 OpenMIPS 处 理 器 的 实现 方 
法 。 读 者 将 发 现 本 书 给 出 的 实现 方法 与 现 有 书籍 的 方法 完全 不 同 ， 更 
加 易于 理解 、 便 于 实践 。 


3.1 系统 设计 目标 
3.1.1 ”设计 目标 


本 书 第 二 篇 设计 实现 的 教学 版 OpenMIPS 处 理 器 ， 是 一 款 具 有 哈佛 
结构 的 32 位 标量 处 理 器 ， 兼 容 MIPS32 Release 1 指令 集 架构 (后 文 不 再 
注 明 Release 1) ， 这 样 的 好 处 是 可 以 使 用 现 有 的 MIPS 编 译 环境 ， 如 : 
GCC 编 译 器 等 。OpenMIPS 的 设计 目标 如 下 。 


五 级 整数 流水 线 ， 分 别 是 : 取 指 、 译 码 、 执 行 、 访 存 、 回 
写 。 

哈佛 结构 ， 分 开 的 指令 、 数 据 接 口 。 

32 个 32 位 整数 寄存 器 。 

。 大 端 模式 。 


。 向 量化 异常 处 理 ， 支 持 精 确 异常 处 理 。 

。 支持 6 个 外 部 中 断 。 

。 具有 32bit 数 据 、 地 址 总 线 宽 度 。 

。 能 实现 单 周期 乘法 。 

。 支持 延迟 转移 。 

。 兼容 MIPS32 指 令 集 架构 ， 支 持 MIPS32 指 令 集 中 的 所 有 整数 
指令 。 


。 大 多 数 指令 可 以 在 一 个 时 钟 周 期 内 完成 。 


上 述 设 计 目 标 都 很 容易 理解 ， 除 了 延迟 转移 和 精确 异常 ， 前 者 将 
在 第 8 章 “ 转 移 指令 的 实现 ”中 介绍 ， 后 者 将 在 第 11 章 “异常 相关 指令 的 
实现 ”中 介绍 。 


3.1.2 五 级 流水 线 


本 书 讲 的 是 计算 机 中 的 流水 线 ， 首 先 看 一 下 维基 百科 中 对 计算 机 
流水 线 的 定义 : 流水 线 是 指 将 计算 机 指令 处 理 过 程 拆 分 为 多 个 步骤 ， 
并 通过 多 个 硬件 处 理 单元 并 行 执行 来 加 快 指 令 执行 速度 。 此 处 有 两 个 
关键 词 : (1) HRA; 2 并 行 。 指 令 的 处 理 从 直观 上 分 析 至 少 可 以 
拆 分 为 三 步 : 从 存储 器 取出 指令 、 解 释 指 令 、 按 照 解释 的 结果 执行 ， 
简单 地 说 就 是 : 取 指 、 译 码 、 执 行 。 如 果 我 们 只 有 一 个 硬件 处 理 单 
元 ， 这 个 单元 既 要 取 指 ， 又 要 译 码 ， 还 要 执行 ， 假 设 上 述 三 种 操作 都 
可 以 在 时 间 I 完 成 ， 那 么 一 条 指令 的 处 理 时 间 为 3T，n 条 指令 的 处 理 时 
间 就 为 3nT， 但 是 如 果 我 们 设计 有 三 个 硬件 单元 ， 分 别 做 这 三 项 工作 
的 一 项 ， 那 么 就 可 以 在 执行 的 同时 对 下 一 条 指令 译 码 ， 在 对 下 一 条 指 


令 译 码 的 同时 还 可 以 再 取 一 条 指令 ， 这 就 是 经 典 的 三 级 流水 线 ， 如 图 
3-1 所 示 。 


指令 A 
Ant? | 取 指 | rm | 执行 
genl 取 指 | 译 码 | 执行 
> 
4T ST 时 间 


图 3-1 三 级 流水 线 示意 图 


从 图 3-1 可 知 ， 在 三 级 流水 线 上 执行 3 条 指令 所 需 时 间 为 5T， 而 如 
果 没 有 使 用 流水 线 则 需要 9T， 流 水 线 确 实 加 快 了 指令 执行 。ARM7 采 
用 的 就 是 三 级 流水 线 。 但 世间 是 没有 这 么 简单 完美 的 ， 上 面 假设 取 
指 、 译 码 、 执 行 需要 的 时 间 都 是 T， 实 际 并 非 如 此 ， 比 如 取 指 的 时 间 
就 可 能 很 长 ， 假 设 取 指 需要 2T 时 间 ， 那 么 如 图 3-2 所 示 。 


指令 n+2 取 指 译 但 执行 
指令 n+1 取 指 PEN 执行 
指令 n 取 指 译 个 执行 


> 
T 21 3T 4T ST 6T 7T 87 时 间 


图 3-2 ” 取 指 时 间 为 2T 时 的 流水 线 工 作 情况 


可 见 在 3T~4T 的 时 间 段 、5T~6T 的 时 间 段 ， 流 水 线 在 等 待 取 指 结 
束 ， 此 时 译 码 阶段 、 执 行 阶段 都 停滞 ， 这 样 一 来 自然 就 慢 下 来 ， 最 
后 ， 执 行 3 条 指令 所 需 时 间 为 8T。 解 决 取 指 时 间 过 长 的 措施 是 引入 组 
存 (Cache) ， 处 理 器 从 缓存 读 取 指 令 只 需要 1 个 时 钟 周期 。 


还 有 一 种 情况 是 执行 阶段 时 间 过 长 ， 比 如 指令 为 加 载 /存储 指令 
(Load/Store) 时 ， 由 于 涉及 访问 存储 器 ， 执 行 阶段 所 需 的 时 间 就 可 能 
大 于 T， 此 时 也 会 导致 流水 线 停滞 。 为 了 解决 这 种 情况 下 的 流水 线 停 
灌 问 题 ， 引 入 了 五 级 流水 线 ， 分 别 是 : 取 指 、 译 码 、 执 行 、 访 存 、 回 
写 。 如 图 3-3 所 示 。 


指令 n+2 取 指 译 但 执行 访 存 回 写 
指令 n+1l 取 指 译 个 执行 访 存 回 写 
指令 n 取 指 译 但 执行 访 存 回 写 


> 
T 97 3T AT ST 6T 77 时 间 


图 3-3 五 级 流水 线 示意 图 


其 中 访 存 阶 段 (Memory Access) 的 作用 是 从 存储 器 装载 数据 到 寄 
存 器 或 者 将 寄存 器 数据 保存 到 存储 器 ， 当 然 ， 如 果 不 是 Load/Store 指 令 
则 不 需要 这 一 步 ， 此 时 在 访 存 阶 段 就 只 是 将 执行 阶段 的 运算 结果 送 到 
下 一 级 回 写 阶 段 。 回 写 阶 段 (Write Back) 的 作用 是 将 数据 写 入 目的 
寄存 器 。ARM9 就 采用 了 这 种 五 级 流水 线 ，OpenMIPS 的 设计 目标 也 是 
五 级 流水 线 。 具 体 而 言 ， OpenMIPS 五 级 流水 线 各 个 阶段 的 主要 工作 
如 下 。 


。 取 指 阶段 ; 从 指令 存储 器 读 出 指令 ， 同 时 确定 下 一 条 指令 地 
址 。 

译 码 阶段 : 对 指令 进行 译 码 ， 从 通用 寄存 器 中 读 出 要 使 用 的 
寄存 器 的 值 ， 如 果 指 令 中 含有 立即 数 ， 那 么 还 要 将 立即 数 进 
行 符号 扩展 或 无 符号 扩展 。 如 果 是 转移 指令 ， 并 且 满 足 转移 
条 件 ， 那 么 给 出 转移 目标 ， 作 为 新 的 指令 地 址 。 


。 执行 阶段 按照 译 码 阶段 给 出 的 操作 数 、 运 算 类 型 ， 进 行 运 
算 ， 给 出 运算 结果 。 如 果 是 Load/Store 指 令 ， 那 么 还 会 计算 
Load/Store 的 目标 地 址 。 

。 访 存 阶段 : 如 果 是 Load/Store 指 令 ， 那 么 在 此 阶段 会 访问 数 
据 存储 器 ， 反 之 ， 只 是 将 执行 阶段 的 结果 向 下 传递 到 回 写 阶 
段 。 同 时 ， 在 此 阶段 还 要 判断 是 否 有 异常 需要 处 理 ， 如 果 
有 ， 那 么 会 清除 流水 线 ， 然 后 转移 到 异常 处 理 例 程 入 口 地 址 
处 继续 执行 。 

。 回 写 阶段 ; 将 运算 结果 保存 到 目标 寄存 器 。 


读者 可 能 对 上 述 流水 线 各 个 阶段 的 主要 工作 还 不 完全 理解 ， 没 有 
关系， 本 书 也 不 是 一 次 实现 上 述 全 部 工作 ， 而 是 逐步 完善 ， 一 开始 ， 
只 实现 流水 线 各 个 阶段 的 基本 工作 ， 慢 慢 地 丰富 、 完 善 。 


3.1.3 ”指令 执行 周期 


OpenMIPS 设 计 目 标 中 提 到 : 实现 MIPS32 指 令 集 中 的 所 有 整数 指 
S$, 并且 大 多 数 指令 可 以 在 一 个 时 钟 周期 内 执行 完成 。 具 体 而 言 ， 
OpenMIPS 实 现 的 所 有 指令 执行 完成 需要 的 时 钟 周期 如 表 3-1 所 示 。 


表 3-1 OpenMIPS 中 所 有 指令 执行 完成 需要 的 时 钟 周期 


指令 执行 完成 需要 的 时 钟 周期 
[| 


乘 累 减 指 令 msub、msubu 2 


NB-1RUTIAHE. 


(1) OpenMIPS 计 划 采 用 试 商法 完成 除法 运算 ， 对 于 32 位 的 除 
法 ， 执 行 阶段 至 少 需要 32 个 时 钟 周 期 ， 再 加 上 一 些 准 备 工 作 需 要 的 时 
钟 周 期 ， 最 后 需要 36 个 时 钟 周期 才能 执行 完成 。 在 第 7 章 “ 算 术 操作 指 
令 的 实现 ”中 会 具体 介绍 除法 指令 的 实现 过 程 。 


(2) 乘 累加 指令 madd、maddu， 乘 累 减 指令 msub、msubu 都 需要 
2 个 时 钟 周 期 才能 执行 完成 。 主 要 是 因为 这 4 条 指令 都 要 做 两 次 运算 ， 
一 次 乘法 、 一 次 加 /减法 ， 如 果 将 这 两 次 运算 放 在 执行 阶段 的 一 个 时 钟 
周期 中 完成 ， 那 么 会 使 执行 阶段 所 需要 的 时 间 明 显 增加 ， 从 而 降低 
OpenMIPS 工 作 时 钟 的 频率 ， 因 此 ，OpenMIPS 设 计 在 执行 阶段 使 用 两 
个 时 钟 周期 完成 这 4 条 指令 ， 一 个 时 钟 周 期 进行 乘法 ， 下 一 个 时 钟 周期 
进行 加 /减法 。 在 第 7 章 * 算 术 操作 指令 的 实现 ”中 会 具体 介绍 乘 累加 、 
乘 累 减 指令 的 实现 过 程 。 


3.2 ”教学 版 OpenMIPS 处 理 器 接口 


教学 版 OpenMIPS 处 理 器 的 外 部 接口 如 图 3-4 所 示 。 采 用 左边 是 输 
入 接口 ， 右 边 是 输出 接口 的 方式 绘制 ， 这 样 比较 直观 ， 便 于 理解 。 各 
接口 的 描述 如 表 3-2 所 示 ， 可 以 分 为 三 类 : 系统 控制 接口 (包括 复位 、 
时 钟 、 中 断 ; 、 指 令 存 储 器 接口 、 数 据 存储 器 接口 。 


OpenMIPS (教学 版 ) 


— rst timer_int_o 
clk rom_ce_o — 
rom data 1 rom_addr_o —— 
ram_data i ram addr o —— 
int i ram_data o —— 
ram_sel_o 上 一 一 
ram we o 上 
ram ce_0 | 一 一 


图 3-4 教学 版 OpenMIPS 处 理 器 的 外 部 接口 


表 3-2 ”教学 版 OpenMIPS 处 理 器 外 部 接口 描述 


接口 名 | 宽度 (bit) | 输入 /输出 
Tst 输入 


复位 信号 
32 # 取 得 的 指令 
2 从 数据 存储 器 读 取 的 数据 
occa 数据 存储 器 的 写 操作 , 为 1 表示 是 写 操作 
EEE 


a ee E 
ECO FECC CI E 要 写 入 数据 存储 器 的 数据 
ICO CO CS 6 个 外 部 便 件 中 断 输 入 


3.3 ”文件 说 明 


OpenMIPS 是 五 级 流水 线 处 理 器 ， 流 水 线 各 个 阶段 的 模块 、 对 应 的 
文件 如 图 3-5 所 示 。 图 中 每 个 模块 的 上 方 标注 的 是 模块 名 ， 下 方 标注 的 


是 对 应 的 文件 名 。 模 块 之 间 的 关系 没有 绘 出 ， 因 为 关系 比较 复杂 ， 在 
书 中 不 便 绘 制 ， 读 者 可 以 参考 本 书 光 盘 中 的 “openmips 模 块 连接 关系 
图 .vsd" 文 件 ， 其 中 绘制 了 模块 之 间 话 细 的 连接 天 系 。 


CTRL 
ctrl-v 
取 指 | vea | 执行 访 存 回 写 
PC IFAD ID ID/EX EX EX/MEM MEM MEM/WB CPO 
pc_reg: cp0_reg. 
f_id.v dv 1 bx Fern mem. DAPR 
| ex_mem.v mem wb.v 
| Regfile DIV | | LLbit_reg. 
| | HILO 
div.y | 
regfile.v 


图 3-5 ”OpenMIPS 流 水 线 各 个 阶段 的 模块 、 对 应 的 文件 


图 3-5 具 体 说 明 如 下 。 
(1) 取 指 阶段 


e PC 模块 : 给 出 指令 地 址 ， 其 中 实现 指令 指针 寄存 器 PC， 该 寄 
存 器 的 值 就 是 指令 地 址 ， 对 应 pc_reg.v 文 件 。 

。IF/ID 模 块 : 实现 取 指 与 译 码 阶段 之 间 的 寄存 器 ， 将 取 指 阶段 
的 结果 (取得 的 指令 、 指 令 地 址 等 信息 ) 在 下 一 个 时 钟 传递 
到 译 码 阶 段 ， 对 应 if_id.v 文 件 。 


(2) 译 码 阶段 


。 ID 模块 : 对 指令 进行 译 码 ， 译 码 结果 包括 运算 类 型 、 运 算 所 
需 的 源 操作 数 、 要 写 入 的 目的 寄存 器 地 址 等 ， 对 应 id.v 文 件 。 


。 Regfile 模 块 : 实现 了 32 个 32 位 通用 整数 寄存 器 ， 可 以 同时 进 
行 两 个 寄存 器 的 读 操作 和 一 个 寄存 器 的 写 操 作 ， 对 应 regfile.v 
文件 。 

e ID/EX 模 块 : 实现 译 码 与 执行 阶段 之 间 的 寄存 器 ， 将 译 码 阶 
段 的 结果 在 下 一 个 时 钟 周期 传递 到 执行 阶段 ， 对 应 id_ex.v 文 
件 。 


(3) 执行 阶段 


。EX 模 块 : 依据 译 码 阶段 的 结果 ， 进 行 指定 的 运算 ， 给 出 运算 
结果 。 对 应 ex.v 文 件 。 

e DIV 模块 : 进行 除法 运算 的 模块 ， 对 应 div.v 文 件 。 

。EX/MEM 模 块 : 实现 执行 与 访 存 阶段 之 间 的 寄存 器 ， 将 执行 
阶段 的 结果 在 下 一 个 时 钟 周 期 传递 到 访 存 阶 段 ， 对 应 
ex_mem.v 文 件 。 


(4) 访 存 阶段 


e MEM 模块 : 如 果 是 加 载 、 存 储 指令 ， 那 么 会 对 数据 存储 器 进 
行 访 问 。 此 外 ， 还 会 在 该 模块 进行 异常 判断 。 对 应 mem.v 文 
件 。 

e MEM/WBRR: 实现 访 存 与 回 写 阶 段 之 间 的 寄存 器 ， 将 访 存 
阶段 的 结果 在 下 一 个 时 钟 周 期 传递 到 回 写 阶段 ， 对 应 
mem_wb.v 文 件 。 


(5) 回 写 阶段 


e CP0 模 块 : 对 应 MIPS 架 构 中 的 协 处 理 器 CP0。 


。 LLbit 模 块 : 实现 寄存 器 LLbit， 在 链接 加 载 指令 1、 条 件 存储 
指令 sc 的 处 理 过 程 中 会 使 用 到 该 寄存 器 ， 第 9 章 会 详 述 。 

e HILO 模 块 : 实现 寄存 器 HI、LO， 在 乘法 、 除 法 指令 的 处 理 
过 程 中 会 使 用 到 这 两 个 寄存 器 ， 第 7 章 会 详 述 。 


另外 ， 还 有 一 个 CTRL 模 块 ， 在 图 3-5 的 上 部 单独 画 出 。 这 个 模块 
对 应 ctrl.v 文 件 ， 是 用 来 控制 整个 流水 线 的 暂停 、 清 除 等 动作 ， 所 以 不 
便于 将 其 归 入 流水 线 中 的 某 一 个 阶段 。 


本 书 的 附录 A 给 出 了 各 个 模块 的 接口 示意 图 ， 以 及 接口 的 作用 描 
述 。 读 者 可 能 会 感觉 模块 太 多 、 每 个 模块 的 接口 也 太 多 ， 似 乎 很 难 理 
解 ， 这 种 担心 是 不 必要 的 ， 之 前 也 提 到 本 书 不 是 一 次 实现 上 述 全 部 模 
块 ， 而 是 首先 实现 其 中 一 部 分 模块 ， 这 一 部 分 模块 也 只 实现 少量 接 
口 ， 只 要 能 满足 我 们 的 要 求 即 可 ， 然 后 随 着 OpenMIPS 实 现 的 指令 种 类 
越 来 越 多 ， 慢 慢 添 加 模块 、 增 加 接口 。 


3.4 ”实现 方法 


在 写作 本 书 之 前 ， 已 经 出 现 了 一 些 介绍 软 核 处 理 器 实现 的 书籍 ， 
这 些 书 在 介绍 实现 方法 时 有 一 个 共同 点 : 一 次 考虑 所 有 的 指令 、 所 有 
的 情况 ， 然 后 给 出 代码 。 笔 者 认为 这 种 方法 读者 不 易于 接受 ， 而 且 这 
也 不 是 作者 实现 处 理 器 时 采用 的 方法 。 在 本 书 中 ， 笔 者 借鉴 了 软件 开 
发 中 的 “ 增 量 模 型 "概念 ， 使 用 了 一 种 完全 不 同 的 实现 方法 : 先 考虑 最 
简单 的 情况 ， 给 出 代码 ， 然 后 考虑 稍微 多 一 点 的 情况 ， 修 改 、 补 充 代 
码 ， 随 着 考虑 情况 的 增多 ， 不 停 地 修改 、 补 充 人 代码， 最终， 使 代码 实 
HER, 同时 ， 也 符合 读者 的 认识 过 程 。 


在 第 4 章 中 ， 我 们 就 考虑 了 一 种 最 简单 的 情况 一 一 只 实现 一 条 指 
令 ， 这 条 指令 是 逻辑 “或 "指令 ori， 借 助 这 条 指令 ， 可 以 搭建 OpenMIPS 
流水 线 的 结构 ， 此 时 的 数据 流 图 如 图 3-6 所 示 。 读 者 暂时 不 用 理解 其 具 
体 含 义 ， 只 需 与 图 3-7 对 比 ， 体 会 各 自 的 复杂 度 ， 具 体 含义 会 在 第 4 章 


介绍 。 


sig! +H MS 
lua M 
bal > UL» | Sy 
>| 
ee oR 
ELL we | | Ly) 寄存 E | | 
3 存储 器 |) 器 pa > ALU > 
> M 
上 =| krir | 
ALEN X 
Bar 
È \ 展 / 余 x f 
clk | 
| 取 指 En 译 码 i。 执行 Me AER 


图 3-6 ”只 实现 一 条 指令 ori 时 的 数据 流 图 


在 后 续 章 节 中 我 们 依次 实现 逻辑 操作 指令 、 移 位 操作 指令 、 空 指 
令 、 移 动 操 作 指令 、 算 术 操作 指令 、 转 移 指 令 、 加 载 存 储 指令 、 协 处 
理 器 访问 指令 、 异 剃 相 关 措 令 ， 最 终 实 现 MIPS32 指 令 集 染 构 中 定义 的 
所 有 整数 指令 ， 此 时 的 数据 流 图 如 图 3-7 所 示 。 同 样 ， 读 者 此 时 暂 不 用 
理解 其 具体 含义 ， 只 需 与 图 3-6 对 比 ， 体 会 各 自 的 复杂 度 。 


图 3-7 ”实现 MIPS32 指 令 集中 所 有 整数 指令 之 后 的 数据 流 图 


对 比 图 3-6、 图 3-7， 会 发 现 复杂 度 大 大 增加 ， 如 果 笔 者 一 开始 就 
考虑 实现 图 3-7 所 示 的 数据 流 图 ， 那 么 读者 需要 知道 MIPS32 指 令 集 中 
定义 的 所 有 指令 ， 还 要 理解 其 作用 。 显 然 会 增加 理解 难度 。 更 好 的 方 
法 是 ， 一 开始 只 考虑 图 3-6 所 示 的 数据 流 图 ， 读 者 只 需要 理解 指令 ori 的 
作用 ， 然 后 一 步 步 添加 实现 更 多 指令 ， 同 时 丰富 完善 数据 流 图 ， 最 终 
实现 图 3-7 所 示 的 数据 流 图 。 比 如 : 在 添加 实现 转移 指令 的 时 候 ， 就 会 
为 图 3-6 数 据 流 图 中 的 译 码 阶段 增加 “转移 判断 ”模块 ; 在 添加 实现 异常 
相关 指令 的 时 候 ， 就 会 为 图 3-6 数 据 流 图 中 的 访 存 阶段 增加 “异常 判断 ” 
模块 。 


以 上 就 是 本 书 在 实现 OpenMIPS 处 理 器 时 采用 的 实现 方法 ， 第 4 章 
将 实现 最 小 结构 ， 即 只 考虑 执行 一 条 指令 ori。 


第 4 章 ”第 一 条 指令 ori 的 实现 


前 面 几 章 介 绍 了 很 多 预备 知识 ， 也 描绘 了 即将 要 实现 的 OpenMIPS 处 
理 器 的 蓝图 ， 各 位 读者 是 不 是 早已 摩拳擦掌 ， 刀 切 希望 一 展 身 手 了 ， 好 
吧 ， 本 章 我 们 将 实现 OpenMIPS 处 理 器 的 第 一 条 指令 ori， 为 什么 选择 这 条 
指令 作为 我 们 实现 的 第 一 条 指令 呢 ? 答案 就 两 个 字 一 一 简单 ， 指 令 ori 用 来 
实现 逻辑 “或 运算， 选择 一 条 简单 的 指令 有 助 于 我 们 排除 干扰 ， 将 注意 力 
集中 在 流水 线 结构 的 实现 上 ， 当 然 也 可 以 选择 其 他 类 似 的 指令 ， 只 要 简单 
即 可 。 通 过 这 条 简单 措 令 的 实现 ， 本 章 在 4.2 节 将 初步 建立 OpenMIPS 的 五 
级 流水 线 结构 ， 当 我 们 在 后 面 章节 中 实现 其 余 指 令 的 时 候 ， 都 是 在 这 个 初 
步 建立 的 流水 线 结构 上 进行 扩充 。 


在 ori 指 令 实 现 后 ， 要 验证 其 实现 是 否 正 确 ， 所 以 在 4.3 节 建立 了 最 小 
SOPC， 仅 仅 包 含 openMIPS、 指 令 存 储 器 ， 用 于 验证 ori 指 令 是 否 实现 正 
确 ， 后 续 章节 验证 其 余 指 令 的 时 候 ， 都 是 在 这 个 最 小 SOPC 或 者 其 改进 模 
型 上 进行 验证 的 。 


本 章 最 后 介绍 了 MIPS 编 译 环境 的 建立 。 


4.1 ori 指 令 说 明 


ori 是 进行 逻辑 “或 ”运算 的 指令 ， 其 指令 格式 如 图 4-1 所 示 。 


31 26 25 21 20 16 15 0 


ORI 


001101 rs rt immediate 


图 4-1 ”ori 指令 格式 


从 指令 格式 中 可 以 知道 ， 这 是 一 个 I 类 型 的 指令 ，ori 指 令 的 指令 码 是 
6b001101， 所 以 当 处 理 器 发 现 正在 处 理 的 指令 的 高 6bit 是 6b001101 时 ， 就 
知道 当前 正在 处 理 的 是 ori 指 令 。 


指令 用 法 为 : ori rs, rt, immediate ， 作 用 是 将 指令 中 的 16 位 立即 数 
immediate 进 行 无 符号 扩展 至 32 位 ， 然 后 与 索引 为 rs 的 通用 寄存 器 的 值 进行 
逻辑 “或 运算， 运算 结果 保存 到 索引 为 rt 的 通用 寄存 器 中 。 这 里 需要 说 明 
以 下 两 点 。 


(1) 无 符号 扩展 


在 MIPS32 指 令 集 架构 中 ， 经 常会 有 指令 需要 将 其 中 的 立即 数 进行 符号 
扩展 ， 或 者 无 符号 扩展 ， 一 般 都 是 将 n 位 立即 数 扩展 为 32 位 ， 其 中 ， 符 号 
扩展 是 将 n 位 立即 数 的 最 高 位 复制 到 扩展 后 的 32 位 数据 的 高 (32-n) fü, 无 
符号 扩展 则 是 将 扩展 后 的 32 位 数据 的 高 (32-n) 位 都 置 为 0。 以 将 指令 中 的 
16 位 立即 数 扩 展 为 32 位 为 例 ， 表 4-1 给 出 了 当 16 位 立即 数 分 别 是 0x8000、 
0x1000 时 的 符号 扩展 、 无 符号 扩展 的 结果 。 


表 4-1 16 位 立即 数 扩展 举例 


16 位 立即 数 0x8000 0x1000 


符号 扩展 OxFFFF8000 0x00001000 
无 符号 扩展 0x00008000 0x00001000 


(2) 通用 寄存 器 


在 MIPS32 指 令 集 架 构 中 定义 了 32 个 通用 寄存 器 $0-$31，OpenMIPS 实 
现 了 这 32 个 通用 寄存 器 ， 使 用 某 一 个 通用 寄存 器 只 需要 给 出 相应 索引 ， 这 


个 索引 占用 5bit，ori 指 令 中 的 rs、rt 就 是 通用 寄存 器 的 索引 ， 例 如 : 当 rs 为 
5'b00011 时 ， 就 表示 通用 寄存 器 $3。 


4.2 ”流水 线 结构 的 建立 
4.2.1 ”流水 线 的 简单 模型 


数字 电路 有 组 合 逻 辑 、 时 序 逻 辑 之 分 ， 其 中 时 序 逻 辑 最 基本 的 器 件 是 
寄存 器 ， 此 处 的 寄存 器 不 是 在 4.1 节 中 提 到 的 MIPS 架 构 规 定 的 通用 寄存 器 
$0-$31， 后 者 是 一 个 更 高 层面 的 概念 ， 前 者 是 类 似 于 D 触 发 器 这 种 数字 电 
路 的 基本 器 件 。 寄 存 器 按照 给 定时 间 脉 冲 来 进行 时 序 同步 操作 ， 其 使 得 时 
序 逻 辑 电 路 具有 记忆 功能 。 而 组 合 逻 辑 电路 则 由 逻辑 门 组 成 ， 提 供电 路 的 
所 有 逻辑 功能 。 实 际 的 数字 电路 一 般 是 组 合 逻 辑 与 时 序 逻 辑 的 结合 。 如 果 
寄存 器 的 输出 端 和 输入 端 存 在 环 路 ， 这 样 的 电路 称 为 “状态 机 ?”。 状 态 机 的 
简单 模型 如 图 4-2 所 示 。 如 果 寄 存 器 之 间 有 连接 ， 而 没有 上 述 环 路 ， 这 样 的 
电路 结构 称 为 “流水 线 ”。 流 水 线 的 简单 模型 如 图 4-3 所 示 。 


ARA 
CLK 


图 4-2 ”状态 机 的 简单 模型 


ame Hp" ol— angi Hp goh 组 合 逻辑 D" o 
> —— 
CLK aT CLK | ag ED 


24-3 ”流水 线 的 简单 模型 


输入 信号 


在 流水 线 结构 中 ， 信 号 在 寄存 器 之 间 传 递 ， 每 传递 到 一 级 都 会 引起 相 
应 的 组 合 逻 辑 电路 变化 ， 对 这 种 模型 进行 抽象 描述 就 是 寄存 器 传输 级 
(Register Transfer Level, RTL) 。 本 节 接 下 来 要 实现 的 原始 的 OpenMIPS 
五 级 流水 线 结构 就 是 图 4-3 的 扩充 。 


4.2.2 ”原始 的 OpenMIPS 五 级 流水 线 结 
构 


扩充 图 4-3， 可 以 得 到 OpenMIPS 的 原始 数据 流 图 ， 如 图 4-4 所 示 。 这 个 
数据 流 图 还 很 不 完整 ， 在 后 续 章 节 中 会 随 着 实现 指令 的 增加 而 丰富 ， 但 这 
个 原始 的 数据 流 图 已 经 可 以 表达 本 节 要 实现 的 ori 指 令 在 流水 线 中 的 处 理 过 
程 了 。 
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图 4-4 ”原始 的 数据 流 图 


图 中 深 色 部 分 对 应 的 是 图 4-3 中 的 D 触 发 器 ， 深 色 部 分 之 间 的 部 分 对 应 
的 是 图 4-3 中 的 组 合 逻 辑 。 各 个 阶段 完成 的 主要 工作 如 下 。 


。 Ets: 取出 指令 存储 器 中 的 指令 ，PC 值 递增 ， 准 备 取 下 一 条 指 
Yo 

译 码 : 对 指令 进行 译 码 ， 依 据 译 码 结果 ， 从 32 个 通用 寄存 器 中 取 
出 源 操 作 数 ， 有 的 指令 要 求 两 个 源 操 作 数 都 是 寄存 器 的 值 ， 比 如 
or 指令 ， 有 的 指令 要 求 其 中 一 个 源 操作 数 是 指令 中 立即 数 的 扩 
展 ， 比 如 ori 指 令 ， 所 以 这 里 有 两 个 复 用 器 ， 用 于 依据 指令 要 求 ， 
确定 参与 运算 的 操作 数 ， 最 终 确 定 的 两 个 操作 数 会 送 到 执行 阶 
段 。 

执行 阶段 : 依据 译 码 阶段 送 入 的 源 操作 数 、 操 作 码 ， 进 行 运 算 ， 
对 于 ori 指 令 而 言 ， 就 是 进行 逻辑 “或 ”运算 ， 运 算 结果 传递 到 访 存 
阶段 。 

访 存 阶段 : 对 于 ori 指 令 ， 在 访 存 阶段 没有 任何 操作 ， 直 接 将 运算 
结果 向 下 传递 到 回 写 阶段 。 

。 回 写 阶 段 : 将 运算 结果 保存 到 目的 寄存 器 。 


图 4-5 是 为 实现 上 述 数据 流 图 而 设计 的 OpenMIPS 五 级 流水 线 系统 结构 
图 ， 图 中 显示 了 各 个 模块 的 接口 、 连 接 关 系 。 每 个 模块 上 方 是 模块 名 ， 下 
方 是 对 应 的 Verilog HDL 程序 文件 名 。 本 章 的 4.2.4 居 4.2.8 节 将 分 别 介 绍 图 中 
各 个 模块 的 实现 。 
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4.2.3 —EREN 


在 正式 开始 介绍 流水 线 结构 实现 之 前 ， 需 要 给 出 一 些 宏 定义 ， 因 为 在 
OpenMIPS 的 实现 过 程 中 ， 为 了 提高 代码 的 可 读 性 和 易 懂 性 ， 使 用 了 较 多 
的 宏 ， 全 部 的 宏 都 在 文件 defines.v 中 定义 。 此 处 列举 在 本 章 中 会 使 用 的 一 
部 分 宏 ， 后 面 随 着 OpenMIPS 功 能 的 不 断 完善 ， 会 有 更 多 的 宏 添 加 进来 ， 
届时 会 对 新 增加 的 宏 进行 说 明 。 


[大 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 火炎 炎炎 炎炎 = 局 的 7A 定 x 
“define RstEnable 1'b1 // 复 位 信号 有 效 
“define RstDisable 1'b0 // 复 位 信号 无 效 
“define Zeroword 32'h00000000 //32 位 的 数值 9 

“define WriteEnable 1'b1 / /f ERES 

“define WriteDisable 1'b0 7/7 RIES: 

“define ReadEnable 1'b1 // 使 能 读 

“define ReadDisable 1'b0 // 禁 止 读 

“define AluOpBus 7:0 // 译 码 阶段 的 输出 


aluop_o 的 宽度 
“define AluSelBus 2:0 // 译 码 阶 段 的 输出 


alusel_o 的 宽度 


“define InstValid 1'b0 // 指 令 有 效 
“define InstInvalid 1'b1 // 指 令 无 效 
“define True_v 1'b1 / i248" A" 
“define False_v 1'b0 INEA NES" 
“define ChipEnable 1'b1 // 蕊 片 使 能 


“define ChipDisable 1'b0 // 必 片 禁止 


炎炎 炎炎 火炎 火炎 炎炎 火炎 炎炎 火炎 炎炎 类 


“define RegAddrBus 4:0 //Regfile 模 块 的 地 址 


线 宽度 


“define RegBus 31:0 //Regfile 模 块 的 数据 
线 宽度 

‘define Regwidth 32 // 通 用 寄存 器 的 宽度 
“define DoubleRegwidth 64 // 两 倍 的 通用 寄存 器 的 
宽度 

‘define DoubleRegBus 63:0 // 两 倍 的 通用 寄存 器 的 
数据 线 宽度 

“define RegNum 32 // 通 用 寄存 器 的 数量 
“define RegNumLog2 5 // 寻 址 通用 寄存 器 使 用 的 
地 址 位 数 

“define NOPRegAddr 5'b00000 


4.2.4” 取 指 阶 段 的 实现 


取 指 阶段 取出 指令 存储 器 中 的 指令 ， 同 时 ，PC 值 递增 ， 准 备 取 下 一 条 
ES, BHEPC, IF/IDM MER. 


1. PC 模块 


PC 模块 的 作用 是 给 出 指令 地 址 ， 其 接口 描述 如 表 4-2 所 示 。 


表 4-2 ”PC 模块 的 接口 描述 


输入 /输出 


输入 Y 


PC 模块 对 应 的 源 文 件 是 pc_reg.v， 代 码 如 下 ， 可 以 在 本 书 附 带 光 盘 的 
Code\Chapter4\ 目 录 下 找到 源 文件 。 读 者 可 以 使 用 任何 文本 编辑 工具 编辑 该 
文件 ， 笔 者 习惯 使 用 UltraEdit， 所 有 的 代码 都 是 使 用 它 编辑 的 ， 当 然 也 可 
以 使 用 windows 自 带 的 记事 本 。 


endmodule 


其 中 使 用 到 了 一 些 define.v 中 定义 的 宏 ，InstAddrBus 宏 表示 指令 地 址 
线 的 宽度 ， 此 处 定义 为 32，RstEnable 宏 表示 复位 信号 有 效 ， 定 义 为 1b1， 
也 就 是 当 输 入 rst 为 高 电 平 时 ， 表 示 复 位 信号 有 效 。 


在 复位 的 时 候 ， 输 出 的 指令 存储 器 使 能 信号 为 ChipDisable， 表 示 指 令 
存储 器 禁用 ， 其 余 时 刻 指令 存储 器 使 能 信号 为 ChipEnable， 表 示 指 令 存储 
器 使 能 。 


当 指令 存储 器 禁用 时 ，PC 的 值 保 持 为 0%， 当 指令 存储 器 能 使 用 时 ，PC 
的 值 会 在 每 时 钟 周期 加 4， 表 示 下 一 条 指令 的 地 址 ， 因 为 一 条 指令 是 32 
位 ， 而 我 们 设计 的 OpenMIPS 是 可 以 按照 字 节 寻 址 的 ， 一 条 指令 对 应 4 个 字 
节 ， 所 以 PC 加 4 指向 下 一 条 指令 地 址 。 读 者 需要 注意 区 分 : 在 2.7 节 设计 的 
简单 取 指 电路 是 按照 字 寻 址 的 ， 所 以 每 时 钟 周期 PC 加 1。 


2 。IF/ID 模 块 


IF/ID 模 块 的 作用 是 暂时 保存 取 指 阶段 取得 的 指令 ， 以 及 对 应 的 指令 地 
址 ， 并 在 下 一 个 时 钟 传递 到 译 码 阶段 ， 其 接口 描述 如 表 4-3 所 示 。 


4-3 ”IF/ID 模 块 的 接口 描述 


4 阶段 取得 的 指令 对 应 的 地 址 
阶段 取得 的 指令 
译 码 阶段 的 指令 对 应 的 地 址 


详 码 阶段 的 指令 


IF/ID 模 块 对 应 的 源 代码 文件 是 if_id.v， 代 码 如 下 ， 读 者 可 以 在 本 书 附 
带 光盘 的 Code\Chapter 人 目录 下 找到 源 文 件 。 


从 代码 可 以 知道 ， 其 中 只 有 一 个 时 序 电路 ，IF/ID 模 块 只 是 简单 地 将 取 
指 阶 段 的 结果 在 每 个 时 钟 周期 的 上 升 沿 传递 到 译 码 阶 段 。 


4.2.5 ” 译 码 阶段 的 实现 


参考 图 4-5 可 知 ，IF/ID 模 块 的 输出 连接 到 ID 模块 ， 那 么 ， 我 们 的 指令 
此 时 已 经 进入 译 码 阶段 ， 在 此 阶段 ， 将 对 取 到 的 指令 进行 译 码 : 给 出 要 进 
行 的 运算 类 型 ， 以 及 参与 运算 的 操作 数 。 译 码 阶段 包括 Regfile、ID 和 
ID/EX 三 个 模块 。 


1。Regfile 模 块 


Regfile 模 块 实现 了 32 个 32 位 通用 整数 寄存 器 ， 可 以 同时 进行 两 个 寄存 
器 的 读 操 作 和 一 个 寄存 器 的 写 操 作 ， 其 接口 描述 如 表 4-4 所 示 。 


表 4-4 ”Regfile 模 块 接口 描述 表 


rdatal 3 输出 aed 口 输 出 的 寄存 器 值 
raddı2 m) 第 二 个 读 寄存 器 端口 要 读 取 的 寄存 器 的 地 址 
re2 Al 第 二 个 读 寄 存 器 端口 读 使 能 信和 号 


rdata2 3 ft 第 二 个 读 寄存 器 端口 输出 的 寄存 器 值 


Regfile 模 块 对 应 的 源 代码 文件 是 regfile.v， 代 码 如 下 ， 可 以 在 本 书 附带 
光盘 的 Code\Chapter 人 目录 下 找到 regfile.v 文 件 。 


Regfile 模 块 可 以 分 为 四 段 进行 理解 。 


(1) BE: 定义 了 一 个 二 维 的 向 量 ， 元 素 个 数 是 RegNum， 这 是 在 
defines.v 中 的 一 个 宏 定 义 ， 为 32， 每 个 元 素 的 宽度 是 RegBus， 这 也 是 在 
defines.v 中 的 一 个 宏 定 义 ， 也 为 32， 所 以 此 处 定义 的 就 是 32 个 32 位 寄存 
Eño 


(2) BIR: 实现 了 与 寄存 器 操作 ， 当 复位 信号 无 效 时 (rst 为 
RstDisable) ， 在 写 使 能 信号 we 有 效 (we 为 WriteEnable) ， 且 写 操作 目的 
寄存 器 不 等 于 0 的 情况 下 ， 可 以 将 写 输入 数据 保存 到 目的 寄存 器 。 之 所 以 
要 判断 目的 寄存 器 不 为 0， 是 因为 MIPS32 架 构 规 定 $0 的 值 只 能 为 0， 所 以 不 
要 写 入 。WriteEnable 是 defines.v 中 定义 的 宏 ， 表 示 写 使 能 信号 有 效 ， 这 些 
宏 定 义 的 含义 十 分 明显 ， 从 名 称 上 就 可 以 知道 具体 含义 ， 所 以 本 书后 面 对 
宏 定 义 不 册 作出 说 明 ， 除 非 这 个 宏 定 义 的 含义 从 名 称 上 不 易 明白 。 


(3) BER: 实现 了 第 一 个 读 寄存 器 端口 ， 分 以 下 几 步 依次 判断 : 


。 当 复 位 信号 有 效 时 ， 第 一 个 读 寄存 器 端口 的 输出 始终 为 0; 

。 当 复 位 信号 无 效 时 ， 如 果 读 取 的 是 $0， 那 么 直接 给 出 0; 

。 如 果 第 一 个 读 寄存 器 端口 要 读 取 的 目标 寄存 器 与 要 写 入 的 目的 寄 
存 器 是 同一 个 寄存 器 ， 那 么 直接 将 要 写 入 的 值 作为 第 一 个 读 寄存 
器 端口 的 输出 ， 

如 果 上 述 情况 都 不 满足 ， 那 么 给 出 第 一 个 读 寄存 器 端口 要 读 取 的 
目标 寄存 器 地 址 对 应 寄存 器 的 值 ; 

。 第 一 个 读 寄存 器 端口 不 能 使 用 时 ， 直 接 输出 0。 


(4) SOR: 实现 了 第 二 个 读 寄存 器 端口 ， 具 体 过 程 与 第 三 段 是 相 
似 的 ， 不 再 重复 解释 。 

注意 一 点 : 读 寄存 器 操作 是 组 合 逻 辑 电 路 ， 也 就 是 一 旦 输入 的 要 读 取 
的 寄存 器 地 址 raddr1 或 者 raddr2 发 生变 化 ， 那 么 会 立即 给 出 新 地 址 对 应 的 寄 


存 器 的 值 ， 这 样 可 以 保证 在 译 码 阶 段 取 得 要 读 取 的 寄存 器 的 值 ， 而 写 寄存 
器 操作 是 时 序 逻 辑 电 路 ， 写 操作 发 生 在 时 钟 信号 的 上 升 沿 。 


2. IDR 


ID 模块 的 作用 是 对 指令 进行 译 码 ， 得 到 最 终 运算 的 类 型 、 子 类 型 、 源 
操作 数 1、 源 操作 数 2>、 要 写 入 的 目的 寄存 器 地 址 等 信息 ， 其 中 运算 类 型 指 
的 是 逻辑 运算 、 移 位 运算 、 算 术 运 算 等 ， 子 类 型 指 的 是 更 加 详细 的 运算 类 
型 ， 比 如 : 当 运 算 类 型 是 逻辑 运算 时 ， 运 算 子 类 型 可 以 是 逻辑 “或 ”运算 、 
逻辑 “与 运算 、 人 逻辑 “ 异 或 ”运算 等 。ID 模 块 的 接口 描述 如 表 4-5 所 示 。 


4-5 ”ID 模块 的 接口 描述 


AAA AAA a EEE 


E 复位 G 号 
译 人 码 阶 段 的 指令 对 应 的 地 址 
译 码 阶段 的 指令 


arr fer 从 Regfile 输入 的 第 一 个 读 寄存 器 端口 的 输入 
reg2 data i 32 HA 从 Regfile 输入 的 第 二 个 读 寄 存 器 端口 的 输入 
Cr rr re am [Regie BAM As moc EET 
| reg2 read o [1 |: 输出 Regfile 模块 的 第 二 个 读 寄存 器 端口 的 读 使 能 信 与 
5 输出 


Regfile 模块 的 第 一 个 读 寄存 器 端口 的 读 地 址 人 


reg] addr o 


reg2 addr o 


Regfile 模块 的 第 二 个 读 寄 存 器 端口 的 读 地 址 人 


aluop_o 令 要 进行 的 运算 的 子 类 型 


7 ES 
十 箱 出 N 
9 Wily y ` > 
s ET m | oe ee 
CE 
ás |w 


要 进行 的 运算 的 源 操作 数 1 


的 指令 要 进行 的 运算 的 源 操作 数 2 
的 寄存 器 地 吉 
要 写 入 的 目的 寄存 器 


如 下 ， 可 以 在 本 书 附带 光盘 的 


时 


ID 模块 对 应 的 代码 文件 是 idv， 其 内 
Code\Chapter4\ 目 录 下 找到 源 文 件 。 


module id( 
input wire rst, 
input wire[ InstAddrBus] pc_i, 


input wire[ "InstBus] inst_i, 


// 读 取 的 Regfile 的 值 


ID 模 块 中 的 电路 都 是 组 合 人 逻辑 电路 ， 另 外 ， 从 图 4-5 可 知人 D 模 块 与 
Regfile 模 块 也 有 接口 连接 。 其 代码 可 以 分 为 三 段 进行 理解 。 


(1) 第 一 段 : 实现 了 对 指令 的 译 码 ， 依 据 指令 中 的 特征 字段 区 分 指 
令 ， 对 指令 ori 而 言 ， 只 需 通 过 识别 26-31bit 的 指令 码 是 否 为 6b001101， 即 
可 判断 是 否 是 ori 指 令 ， 其 中 的 宏 定 义 EXE_ORI 就 是 6b001101，op 就 是 指 
令 的 26-31bit， 所 以 当 op 等 于 EXE_ORI 时 ， 就 表示 是 ori 指 令 ， 此 时 会 有 以 
下 译 码 结果 。 


。 要 读 取 的 寄存 器 情况 : ori 指 令 只 需要 读 取 rs 寄 存 器 的 值 ， 默 认 通 
过 Regfile 读 端口 1 读 取 的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 21- 
25bit， 参 考 图 4-1 可 知 ， 正 是 ori 指 令 中 的 rs， 所 以 设置 reg1_read_o 
为 1， 通 过 图 4-5 可 以 看 出 ，regl_read_o 连 接 Regfile 的 输入 rel， 
regl_addr_o 连 接 Regfile 的 输入 raddrl ， 结 合 对 Regfile 模 块 的 介绍 
可 知 ， 译 码 阶 段 会 读 取 寄 存 器 rs 的 值 。 指 令 ori 需 要 的 另 一 个 操作 
数 是 立即 数 ， 所 以 设置 reg2_read_o 为 0， 表 示 不 通过 Regfile 读 端 
口 2 读 取 寄 存 器 ， 这 里 暗含 使 用 立即 数 作为 运算 的 操作 数 。imm 就 
是 指令 中 的 立即 数 进行 零 扩 展 后 的 值 。 

要 执行 的 运算 : alusel_o 给 出 要 执行 的 运算 类 型 ， 对 于 ori 指 令 
言 就 是 逻辑 操作 ， 即 EXE_RES_LOGIC。aluop_o 给 出 要 执行 的 运 
算 子 类 型 ， 对 于 ori 指 令 而 言 就 是 逻辑 “或 ”运算 ， 即 
EXE_OR_OP。 这 两 个 值 会 传递 到 执行 阶段 。 

要 写 入 的 目的 寄存 器 : wreg_o 表 示 是 否 要 写 目的 寄存 器 ，ori 指 令 
要 将 计算 结果 保存 到 寄存 器 中 ， 所 以 wreg_o 设 置 为 WriteEnable。 
wd_o 是 要 写 入 的 目的 寄存 器 地 址 ， 此 时 就 是 指令 的 16-20bit， 参 
考 图 4-1 可 知 ， 正 是 ori 指 令 中 的 rt。 这 两 个 值 也 会 传递 到 执行 阶 


段 。 


(2) BOR: 给 出 参与 运算 的 源 操作 数 1 的 值 ， 如 果 reg1_read_o 为 
1， 那 么 就 将 从 Regfile 模 块 读 端 口 1 读 取 的 寄存 器 的 值 作为 源 操作 数 1， 如 
果 regl_read_o 为 0， 那 么 就 将 立即 数 作为 源 操作 数 1， 对 于 ori 而 言 ， 此 处 选 
择 从 Regfile 模 块 读 端 口 1 读 取 的 寄存 器 的 值 作为 源 操作 数 1。 该 值 将 通过 
reg1_o 端 口 被 传递 到 执行 阶段 。 


(3) BER: 给 出 参与 运算 的 源 操作 数 2 的 值 ， 如 果 reg2_read_o 为 
1， 那 么 就 将 从 Regfile 模 块 读 端 口 2 读 取 的 寄存 器 的 值 作为 源 操作 数 2， 如 
果 reg2_read_o 为 0， 那 么 就 将 立 lb 对 于 ori 而 言 ， 此 处 选 
择 立 即 数 imm 作 为 源 操 作 数 2。 该 值 将 通过 reg2_o 端 口 被 传递 到 执行 阶段 。 


3。ID/EX 模 块 


参考 图 4-5 可 知 ，ID 模 块 的 输出 连接 到 ID/EX 模 块 ， 后 者 的 作用 是 将 译 
码 阶段 取得 的 运算 类 型 、 源 操作 数 、 要 写 的 目的 寄存 器 地 址 等 结果 ， 在 下 
一 个 时 钟 传递 到 流水 线 执行 阶段 。 其 接口 描述 如 表 4-6 所 示 。 


74-6 ”ID/EX 模 块 的 接口 描述 


接口 名 | 宽度 (bit) | 输入 /输出 
1 输入 复位 信号 
1 Ai 时 钟 信号 
id_alusel 3 f 译 码 阶段 的 指令 要 进行 的 运算 的 类 型 


mr 
id wd 译 伺 阶段 的 指令 要 写 入 的 目的 寄存 右 地 赴 
id_wreg 泽 码 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 
= 


3 Sí 运算 的 源 操作 数 1 


ex regl 
ex reg2 32 行 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 


行 阶段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 


ex_wreg 


: 
7 
8 
fe E 


ID/EX 模 块 对 应 的 代码 文件 是 id_ex.v ， 其 内 容 如 下 ， 可 以 在 本 书 附带 
光盘 的 Code\Chapter 人 目录 下 找到 源 文件 。 


if (rst == “RstEnable) begin 
ex_aluop <= "EXE_NOP_OP; 
ex_alusel <= "EXE_RES_NOP; 
ex_reg1 <= Zeroword; 
ex_reg2 <= "ZeroWord; 
ex_wd <= "NOPRegAddr; 
ex_wreg <= “WriteDisable; 

end else begin 
ex_aluop <= id_aluop; 
ex_alusel <= id_alusel; 
ex_regi <= id_regi; 
ex_reg2 <= id_reg2; 
ex_wd <= id_wd; 
ex_wreg <= id_wreg; 

end 


end 


endmodule 


代码 十 分 清晰 ， 其 中 只 有 一 个 时 序 电路 ，ID/EX 模 块 只 是 简单 地 将 译 
码 阶段 的 结果 在 时 钟 周期 的 上 升 治 传递 到 执行 阶段 。 执 行 阶段 将 依据 这 些 
值 进 行 运算 。 


4.2.6 ”执行 阶段 的 实现 


现在 ， 指 令 已 经 进入 流水 线 的 执行 阶段 了 ， 在 此 阶段 将 依据 译 码 阶段 
的 结果 ， 对 源 操作 数 1、 源 操作 数 2， 进 行 指定 的 运算 。 执 行 阶段 包括 EX、 
EX/MEM 两 个 模块 。 


1。EX 模 块 


观察 图 4-5 中 ID/EX 与 EX 模块 的 端口 连接 关系 可 知 ，EX 模 块 会 从 ID/EX 
模块 得 到 运算 类 型 alusel _i、 运 算 子 类 型 aluop_i、 源 操作 数 regl_i、 源 操作 
数 reg2_i、 要 写 的 目的 寄存 器 地 址 wd_i。EX 模 块 会 依据 这 些 数 据 进行 运 
算 ， 其 接口 描述 如 表 4-7 所 示 。 


表 4-7 EX 模块 的 接口 描述 


rn E rr 复位 仿 

DT ECE Ge 

(12 执行 阶段 要 进行 的 运算 的 子 类 型 

(117 参与 运算 的 源 操作 数 1 

wd i 5 全 指令 执行 要 写 入 的 目的 寄存 器 地 址 

wreg i 1) 是 否 有 要 写 入 的 目的 寄存 器 

wd o 5 输出 执行 阶段 的 指令 最 终 要 写 入 的 目的 寄存 器 地 址 


wreg o MH 执行 阶段 的 指令 最 终 是 否 有 要 写 入 的 目的 寄存 器 


32 fili 执行 阶段 的 指令 最 终 概 写 入 目的 寄存 器 的 值 


EX 模块 对 应 的 代码 文件 为 ex.v， 其 内 容 如 下 ， 可 以 在 本 书 附 带 光 盘 的 
Code\Chapter4\ 目 录 下 找到 源 文件 。 


CHEZ 
| 
6 
7 
8 
9 


o 


module ex( 


input wire rst, 


// 译 码 阶段 送 到 执行 阶段 的 信息 


input wire[ AluOpBus] aluop_i, 
input wire[ AluSelBus ] alusel_i, 
input wire[ RegBus] regi_i, 
input wire[ RegBus] reg2_i, 


input wire[ RegAddrBus] wd_i, 


case ( alusel_i ) 
"EXE_RES_LOGIC: begin 
wdata_o <= logicout; // wdata_o 中 存放 运算 结果 
end 
default: begin 
wdata_o <= ~Zeroword; 
end 
endcase 


end 


endmodule 
EX 模块 中 都 是 组 合 逻 辑 电路 ， 上 述 代码 可 以 分 为 两 段 理解 。 


(1) 第 一 段 : 依据 输入 的 运算 子 类 型 进行 运算 ， 这 里 只 有 一 种 ， 就 
是 逻辑 “或 运算， 运算 结果 保存 在 logicout 中 ， 这 个 变量 专门 用 来 保存 逻辑 
操作 的 结果 ， 以 后 还 会 添加 算术 运算 、 移 位 运算 等 ， 届 时 ， 会 定义 一 些 新 
9 变量 保存 对 应 的 运算 结果 。 


(2) BIR: 给 出 最 终 的 运算 结果 ， 包 括 是 否 要 写 目 的 寄存 器 
wreg_0、 要 写 的 目的 寄存 器 地 址 wd_o、 要 写 入 的 数据 wdata_o。 其 中 
wreg_0、wd_o 的 值 都 直接 来 自 译 码 阶 段 ， 不 需要 改变 ，wdata_o 的 值 要 依 
据 运 算 类 型 进行 选择 ， 如 果 是 逻辑 运算 ， 那 么 将 logicout 的 值 赋 给 
wdata_o。 此 处 实际 上 是 为 以 后 扩展 做 准备 ， 当 添加 其 他 类 型 的 指令 时 ， 
只 需要 修改 这 里 的 case 情 况 即 可 。 


2。EX/MEM 模 块 


参考 图 4-5 可 知 ，EX 模 块 的 输出 连接 到 EX/MEM 模 块 ， 后 者 的 作用 是 
将 执行 阶段 取得 的 运算 结果 ， 在 下 一 个 时 钟 传递 到 流水 线 访 存 阶段 ， 其 接 


口 描述 如 表 4-8 所 示 。 


表 4-8 EX/MEM 模 块 的 接口 描述 


TEL II 
‚Jo 


复位 信号 
时 钟 信号 
执行 阶段 的 指令 执行 后 要 写 入 的 目的 寄存 器 地 址 


ex_wreg HAIR AAA ATS H A a Fa 
ex_wdata 执行 阶段 的 指令 执行 后 要 写 入 目的 寄存 器 的 值 
mem wd E 访 存 阶段 的 指令 要 写 入 的 目的 寄存 器 地 址 

mem wreg 访 存 阶 段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 

mem wdata 访 存 阶段 的 指令 要 写 入 日 的 寄存 器 的 值 


EX/MEM 模 块 对 应 的 代码 文件 是 ex_mem.v， 内 容 如 下 ， 可 以 在 本 书 附 
带 光盘 的 Code\Chapter 人 目录 下 找到 源 文件 。 


always @ (posedge clk) begin 

if(rst == "RstEnable) begin 
mem_wd <= "NOPRegAddr; 
mem_wreg <= ‘WriteDisable; 
mem_wdata <= "ZeroWord; 

end else begin 
mem_wd <= ex_wd; 
mem_wreg <= ex_wreg; 
mem_wdata <= ex_wdata; 

end 


end 


endmodule 


十 分 简单 ， 其 中 只 有 一 个 时 序 逻 辑 电 路 ， 在 时 钟 上 升 沿 ， 将 执行 阶段 
的 结果 传递 到 访 存 阶段 。 


4.2.7 ” 访 存 阶段 的 实现 


现在 ，ori 指 令 进入 访 存 阶段 了 ， 但 是 由 于 ori 指 令 不 需要 访问 数据 存储 
器 ， 所 以 在 访 存 阶段 ， 不 做 任何 事 ， 只 是 简单 地 将 执行 阶段 的 结果 向 回 写 
阶段 传递 即 可 。 


流水 线 访 存 阶段 包括 MEM、MEM/AWB 两 个 模块 。 
1。MEM 模 块 


MEM 模 块 的 接口 描述 如 表 4-9 所 示 。 


4-9 MEM 模 块 的 接口 描述 


访 存 


的 指令 要 写 入 的 目的 寄存 器 地 址 
的 指令 是 否 有 要 写 入 的 目的 寄存 器 


的 指令 要 写 入 目的 寄存 器 的 值 


的 指令 最 终 要 写 入 的 目的 寄存 器 地 址 


的 指令 最 终 是 否 有 要 写 入 的 目的 寄存 器 


访 存 阶段 的 指令 最 终 要 写 入 目的 寄存 器 的 值 


MEM 模 块 的 代码 位 于 文件 mem.v， 内 容 如 下 ， 可 以 在 本 书 附带 光盘 的 


Code\Chapter 人 目录 下 找到 源 文件 。 


wd_o <= "NOPRegAddr; 
wreg_o <= "WriteDisable; 
wdata_o <= ~Zeroword; 

end else begin 
wd_o <= wd_i; 
wreg_o <= wreg_i; 
wdata_o <= wdata_i; 

end 


end 


endmodule 


MEM 模 块 中 只 有 一 个 组 合 逻 辑 电 路 ， 将 输入 的 执行 阶段 的 结果 直接 
作为 输出 ， 参 考 图 4-5 可 知 ，MEM 模 块 的 输出 连接 到 MEM/WB 模 块 。 


2. MEM/WB 模 块 


MEM/WB 模 块 的 作用 是 将 访 存 阶段 的 运算 结果 ， 在 下 一 个 时 钟 传递 到 
回 写 阶段 ， 其 接口 描述 如 表 4-10 所 示 。 


表 4-10 MEM/WB 模 块 的 接口 描述 


clk 1 输入 时 钟 信号 
3 mem_wd 5 输入 访 存 阶段 的 指令 最 终 要 写 入 的 日 的 寄存 器 地 址 


a [mem weg |ı | 输入 | 访 存 阶段 的 指令 最 终 是 否 有 要 写 入 的 日 的 寄存 器 
沪 存 阶段 的 指令 最 终 要 写 入 目的 寄存 器 的 值 
价 段 的 指令 要 写 入 的 目的 寄存 器 地 址 


续 表 
ia it 
Geet eee eee 


MEM/WB 模 块 的 代码 位 于 mem_wb.v 文 件 ， 其 主要 内 容 如 下 ， 可 以 在 
本 书 附带 光盘 的 Code\Chapter 人 目录 下 找到 源 文件 。 


wb_wdata <= mem_wdata; 
end 


end 


endmodule 


MEM/WB 的 代码 与 MEM 模 块 的 代码 十 分 相似 ， 都 是 将 输入 信号 传递 

到 对 应 的 输出 端口 ， 但 是 MEM/WB 模 块 中 的 是 时 序 逻 辑 电 路 ， 即 在 时 钟 上 
沿 才 发 生 信 号 传递 ， 而 MEM 模 块 中 的 是 组 合 逻 辑 电 路 。MEM/WB 模 块 
将 访 存 阶段 指令 是 否 要 写 目 的 寄存 器 mem_wreg、 要 写 的 目的 寄存 器 地 址 
mem_wd、 要 写 入 的 数据 mem_wdata 等 信息 传递 到 回 写 阶段 对 应 的 接口 


wb_wreg、 wb_wd, wb_wdatao 


4.2.8” 回 写 阶 段 的 实现 


经 过 上 面 的 传递 ，ori 指 令 的 运算 结果 已 经 进入 回 写 阶 段 了 ， 这 个 阶段 
实际 上 是 在 Regfile 模 块 中 实现 的 ， 从 图 4-5 可 知 ，MEM/WB 模 块 的 输出 
Wb_wreg、wb_wd、wb_wdata 连 接 到 Regfile 模 块 ， 分 别 连接 到 写 使 能 端口 
we、 写 操作 目的 寄存 器 端口 waddr、 写 入 数据 端口 wdata， 所 以 会 将 指令 蕉 
运算 结果 写 入 目的 寄存 器 ， 具 体 代码 可 以 参考 Regfile 模 块 。 


4.2.9 ”顶层 模块 OpenMIPS 的 实现 


顶层 模块 OpenMIPS 在 文件 openmips.v 中 实现 ， 主 要 内 容 就 是 对 上 面 实 
现 的 流水 线 各 个 阶段 的 模块 进行 例 化 、 连 接 ， 连 接 关 系 就 如 图 4-5 所 示 。 在 
本 章 实现 的 OpenMIPS 模 块 的 接口 如 图 4-6 所 示 ， 还 是 采用 左边 是 输入 接 
口 ， 右 边 是 输出 接口 的 方式 绘制 ， 便 于 理解 ， 各 接口 的 说 明 如 表 4-11 所 


示 。 可 见 与 第 3 章 的 系统 蓝图 还 有 较 大 差距 ,很 多 接口 都 没有 有， 在 后 续 
节 随 着 OpenMIPS 实 现 指令 的 增多 ， 会 逐步 完善 ， 最 终 实现 第 3 章 的 系统 


Zlo 


Open MIPS 
rst 
clk rom_ce_o m 
rom_data_i rom_addr_o }—— 


openmips.v 


图 4-6 ”OpenMIPS 模 块 接口 


表 4-11 ”OpenMIPS 模 块 的 接口 描述 


输入 


输入 /输出 


复位 信号 
时 钟 信和 中 


输入 
rom data i 输入 


代码 如 下 ， 可 以 在 本 书 附带 光盘 的 Code\Chapter4\ 目 录 下 找到 源 文 件 。 


module openmips( 


从 指令 存储 器 取得 的 指令 
输出 到 指令 存储 器 的 地 址 
指令 存储 器 使 能 信号 


input wire clk, 

input wire fst, 

input wire[ RegBus | rom_data_i, 
output wire[ 'RegBus] rom_addr_o, 
output wire rom_ce_o 


); 


+ == 
AER 
ATE 
1X 
Lom 


A] 


// 送 到 MEM/WB 模 块 的 信息 
.wd_o(mem_wd_o), .wreg_o(mem_wreg_o), 
.wdata_o(mem_wdata_o) 


); 


// MEM/WB 模 块 例 化 
mem_wb mem_wb0 ( 


.clk(clk), .rst(rst), 


// 来 自 访 存 阶 段 MEM 模 块 的 信息 
.mem_wd(mem_wd_o), .mem_wreg(mem_wreg_o), 


.mem_wdata(mem_wdata_o), 


// 送 到 回 写 阶 段 的 信息 
.Wh_wd(wb wd i), .wb_wreg(wb_wreg_i), 
.wo_wdata(wb_wdata_i) 


i 


endmodule 


至 此 ，ori 指 令 的 流水 线 之 旅 已 经 结束 了 ， 一 个 原始 而 简单 的 五 级 流水 
线 结构 也 已 经 建立 了 ， 有 读者 可 能 会 怀疑 区 区 百 十 行 代 码 就 实现 了 流水 
线 ， 是 不 是 太 简单 了 ? 有 这 样 的 怀疑 是 正常 的 ， 的 确 很 简单 ， 但 是 简单 并 
不 代表 简陋 ， 不 代表 错误 ， 流 水 线 实 际 上 并 不 是 大 家 想象 的 那么 复杂 ，4.3 
节 ， 将 验证 本 节 实 现 的 流水 线 能 不 能 正确 工作 ， 能 不 能 正确 执行 ori 指 令 。 


4.3 ”验证 OpenMIPS 实 现 效 果 


4.3.1 ”指令 存储 器 ROM 的 实现 


本 节 将 验证 我 们 的 OpenMIPS 是 否 实现 正确 ， 包 含 : 流水 线 是 否 正 
确 、ori 指 令 是 否 实现 正确 。 在 验证 之 前 ， 需 要 首先 实现 指令 人 存储器， 以 便 
OpenMIPS 从 中 读 取 指 令 。 


指令 存储 器 ROM 模 块 是 只 读 的 ， 其 接口 如 图 4-7 所 示 ， 还 是 采用 左边 
是 输入 接口 、 右 边 是 输出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 含义 如 表 
4-12 所 示 。 


ROM 


ce inst 


addr 


inst_rom.v 


图 4-7 指令 存储 器 ROM 模 块 接 口 图 


R412 ”指令 存储 器 ROM 模 块 的 接口 描述 


指令 存储 器 ROM 模 块 在 文件 inst_rom.v 中 实现 ， 代 码 如 下 ， 可 以 在 本 
书 附带 光盘 的 Code\Chapter 人 目录 下 找到 源 文件 。 


module inst_rom( 
input wire ce, 


input wire[ InstAddrBus] addr, 


output reg[ InstBus] inst 


); 
‚I 定义 一 个 数组 ， 大 小 是 InstMemNum， 元 素 宽 度 是 InstBus 


reg[ InstBus] inst_mem[0:”InstMemNum-1]; 


// 使 用 文件 inst_rom.data 初 始 化 指令 存储 器 


initial $readmemh ( "inst_rom.data", inst_mem ); 


// 当 复 位 信号 无 效 时 ， 依 据 输 入 的 地 址 ， 给 出 指令 存储 器 ROM 中 对 应 的 元 素 
always @ (*) begin 
if (ce == "ChipDisable) begin 
inst <= "ZeroWord; 
end else begin 
inst <= inst_mem[addr[ "InstMemNumLog2+1:2]]; 
end 


end 


endmodule 
这 个 代码 很 好 理解 ， 有 以 下 几 点 说 明 。 


(1) 在 初始 化 指令 存储 器 时 ， 使 用 了 initial 过 程 语 句 。initial 过 程 语句 
只 执行 一 次 ， 通 常用 于 仿真 模块 中 对 激励 向 量 的 描述 ， 或 用 于 给 变量 赋 初 
值 ， 是 面向 模拟 仿真 的 过 程 语句 ， 通 常 不 能 被 综合 工具 支持 。 所 以 如 果 要 
将 本 章 实 现 的 OpenMIPS 处 理 器 使 用 综合 工具 进行 综合 ， 那 么 需要 修改 这 
里 初始 化 指令 存储 器 的 方法 。 


(2) 在 初始 化 指令 存储 器 时 ， 使 用 了 系统 水 数 $readmemh， 表 示 从 
inst_rom.data 文 件 中 读 取 数据 以 初始 化 inst_mem， 而 inst_mem 正 是 之 前 定 


义 的 数组 。inst_rom.data 是 一 个 文本 文件 ， 里 面 存储 的 是 指令 ， 其 每 行 存 
储 一 条 32 位 宽度 的 指令 〈 使 用 十 六 进 制 表示 ) , AK MSreadmemhs 
inst_rom.data 中 的 数据 依次 填写 到 inst_mem 数 组 中 。 


(3) OpenMIPS 是 按照 字 节 寻 址 的 ， 而 此 处 定义 的 指令 存储 器 的 每 个 
地 址 是 一 个 32bit 的 字 ， 所 以 要 将 OpenMIPS 给 出 的 指令 地 址 除 以 4 再 使 用 ， 
比如 : 要 读 取 地 址 0xC 处 的 指令 ， 那 么 实际 就 是 对 应 ROM 的 inst_mem[3]， 
如 图 4-8 所 示 。 


OpenMIPS 给 出 


ROM 
的 指令 地 址 
0xC  —————»> Byte3 | Byte? | Bytel | Byte0 | inst_mem[3] 
0x8 ——W—~— Byte3 | Byte? | Bytel | Byte0 | inst_mem[2] 
0x4 “一 一 一 过 Byte3 | Byte? | Bytel | Byte0 | inst_mem[1] 
0x0 —————»>| Byte3 | Byte? | Bytel | Byte0 | inst_mem[0] 


图 4-8 ”OpenMIPS 给 出 的 指令 地 址 与 ROM 中 元 素 位 置 的 关系 


除 以 4 也 就 是 将 指令 地 址 右 移 2 位 ， 所 以 在 读 取 的 时 候 给 出 的 地 址 是 
addr[`InstMemNumLog2 +1:2]， 其 中 InstMemNumLog2 是 指令 存储 器 的 实际 
地 址 宽度 ， 比 如 : 如 果 inst_mem 有 1024 个 元 素 ， 那 么 InstMemNum 等 于 
1024，InstMemNumLog2 等 于 10， 表 示 实 际 地 址 宽度 为 10。 


4.3.2 ”最 小 SOPC 的 实现 


为 了 验证 ， 需 要 建立 一 个 SOPC， 其 中 仪 OpenMIPS、 指 令 存储 器 
ROM， 所 以 是 一 个 最 小 SOPC。OpenMIPS 从 指令 存储 器 中 读 取 指令 ， 指 令 


进入 OpenMIPS 开 始 执行 。 最 小 SOPC 的 结构 如 图 4-9 所 示 。 


OpenMIPS 


ROM 


ce inst 


rst 
rom ce 0 
clk 一 ”一 


addr 


inst_rom.v 


rom_data_i rom addr o 


openmips.v 


图 4-9 ”最 小 SOPC 的 结构 


最 小 SOPC 对 应 的 模块 是 openmips min sopc ， 位 于 文件 
openmips_min_sopc.v 中 ， 读 者 可 以 在 本 书 附带 光盘 的 Code\Chapter 个 目录 
下 找到 该 文件 ， 主 要 内 容 如 下 。 在 其 中 例 化 了 处 理 器 OpenMIPS、 指 令 存 
储 器 ROM， 并 将 两 者 按照 图 4-9 的 方式 进行 连接 。 


module openmips_min_sopc( 


input wire clk, 


input wire rst 


) ) 


// 连接 指令 存储 器 
wire[ InstAddrBus] inst_addr; 
wire[ InstBus] inst; 


wire rom_ce; 


// 例 化 处 理 器 OpenMIPS 


openmips openmipso( 


.cLk(clk), 四 ES 本 es ma BS 
.rom_addr_o(inst_addr), .rom_data_i(inst), 
. rom_ce(rom_ce) 


); 


// 例 化 指令 存储 器 ROM 
inst_rom inst_rom0( 
.ce(rom_ce), 
.addr(inst_addr), .inst(inst) 


}i 


endmodule 


4.3.3 ”编写 测试 程序 


我 们 需要 写 一 段 测 试 程序 ， 并 将 其 存储 到 指令 存储 器 ROM， 这 样 当 
4.3.2 节 建立 的 最 小 SOPC 开 始 运 行 的 时 候 ， 就 会 从 ROM 中 取出 我 们 的 程 
序 ， 送 入 OpenMIPS 处 理 器 执行 。 由 于 目前 的 OpenMIPS 只 实现 了 一 条 ori 指 
令 ， 所 以 测试 程序 很 简单 ， 如 下 所 示 ， 对 应 本 书 附带 光盘 
Code\Chapter4\TestAsm 目 录 下 的 inst_rom.S 文 件 。 


ori $1, $0, 0x1100 # $1 = $0 | 0x1100 = 0x1100 
ori $2,$0,0x0020 # $2 = $0 | 0x0020 = 0x0020 
ori $3, $0, 0xff00 # $3 = $0 | Oxff00 = OXff00 
Ori $4, $0, Oxf fff # $4 = $0 | oxffff = oxffff 


测试 程序 共有 4 条 指令 ， 都 是 ori 指 令 。 


第 1 条 指令 将 0x1100 进 行 零 扩 展 后 与 寄存 器 $0 进行 逻辑 “或 ”运算 ， 结 
果 保 存在 寄存 器 $1 中 。 


第 2 条 指令 将 0x0020 进 行 零 扩展 后 与 寄存 器 $0 进行 逻辑 “或 ”运算 ， 结 
果 保 存在 寄存 器 $2 中 。 


第 3 条 指令 将 0xff00 进 行 零 扩 展 后 与 寄存 器 $0 进 行 逻 辑 * 或 "运算 ， 结 果 
保存 在 寄存 器 $3 中 。 


第 4 条 指令 将 0xffff 进 行 零 扩展 后 与 寄存 器 $0 进 行 逻 辑 " 或 运算， 结果 
保存 在 寄存 器 $4 中 。 


虽 令 的 注释 说 明了 指令 的 执行 结果 。 接 下 来 ， 按 照 正 常 的 顺序 应 该 是 
使 用 编译 器 编译 我 们 的 测试 程序 ， 但 由 于 GCC 编译 器 的 安装 、 使 用 、 
Makefile 文 件 的 制作 等 内 容 还 需要 不 少 篇 幅 讲 解 ， 而 想必 各 位 读者 和 笔者 
一 样 ， 急 切 地 想 知 道 OpenMIPS 是 否 实现 正确 ， 所 以 本 节 采 用 手工 编译 的 
方式 编译 测试 程序 ，4.4 节 将 专题 介绍 GCC 编译 器 的 使 用 。 


手工 编译 只 须 按照 指令 内 容 填 充 进 如 图 4-1 所 示 的 ori 指 令 格式 中 ， 即 
可 得 到 对 应 的 二 进 制 字 ， 比 如 : 对 于 指令 ori $1,$0,0x1100， 对 应 的 二 进 制 
字 如 图 4-10 所 示 。 


31 26 25 21 20 16 15 0 


ORI 


001101 00000 00001 0001 0001 0000 0000 


图 4-10 ”指令 ori $1,$0,0x1100 对 应 的 二 进 制 字 


转化 为 十 六 进 制 即 0x34011100， 其 余 3 条 指令 按照 同样 的 方式 可 以 得 
到 对 应 的 二 进 制 字 ， 按 照 $readmemh 国 数 的 要 求 ， 一 行 放 一 条 指令 ， 得 到 
测试 程序 对 应 的 isnt_ rom.data 文件 如 下 ， 可 在 本 书 附 带 光 盘 的 
Code\Chapter4\TestAsm 目 录 下 找到 同名 文件 。 


4.3.4 建立 Test Bench 文 件 


本 节 将 建立 Test Bench 文 件 ， 其 中 给 出 最 小 SOPC 运 行 所 需 的 时 钟 信 
号 、 复 位 信号 。 代 码 如 下 ， 对 应 本 书 附带 光盘 Code\Chapter4 目 录 下 的 
openmips_min_sopc_tb.v 文 件 。 


rst = ~RstEnable; 
#195 rst= "RstDisable; 
#1000 $stop; 


end 


// 例 化 最 小 SOPC 
openmips_min_sopc openmips_min_sopco( 
.clk(CLOCK_50), 
.rst(rst) 
); 


endmodule 


4.3.5 “使 用 Modelsim 检 验 OpenMIPS 实 
现 效果 


万 事 俱 备 ， 只 欠 东 风 了 ， 本 节 是 验证 前 的 最 后 一 步 
工程 ， 进 行 仿真 。 参 考 第 2 章 的 介绍 ， 新 建 一 个 ModelSim 工 程 ， 工 程 名 可 
以 为 openmips_min_sopc， 将 上 文 创建 的 OpenMIPS 所 有 源 文件 、Test Bench 
文件 、 指 令 存 储 器 的 源 文件 等 (也 就 是 本 书 附 带 光盘 Code\Chapter4 目 录 下 
所 有 .v 文 件 ) 添加 到 工程 中 ， 然 后 编译 。 


注 
目录 下 。 


: 还 需要 将 4.3.4 节 制作 的 inst_rom.data 文 件 复 制 到 ModelSim 工 程 


eat 


编译 通过 后 ， 将 workspace 切 换 到 Library 选 项 卡 ， 打 开 work 这 个 
library， 选 中 openmips_min_sopc_tb ， 用 鼠标 右键 单 击 ， 选 择 Simulate 选 
页 ， 如 图 4-11 所 示 。 


ame vrype Pat 


| work Library F:/Openh 


[nv] regfile Module F:/Openh 
区 Module F:/Openi‘ 
i i H tadule F:/Open 
| openmips_min_sopc F:/Openh 
Ih) openmips ee NEUEN at F:/Openi 
IK] mem_wb nı a F:/Openi‘ 
ivi] mem er EEE F:/Openh 
加 inst_rom Edit F:/Opent 
fv) if_id an zer F:/Openh 
(ná) id_reg zur F:/Openh 
Ih] id_ex PE F:/Openh 
IMi] id Update F:/Openh 
iii i :/Open 
114) ex_reg Create Wave F:/Opents 
MN] ex_mem F:/Openh 
IN] ex Delete F:/Openh 
fiig wi (unavailable) Copy wi 
Hii, vital2000 ra > SMODEL_ 
+H verilog SMODEL_ 
Hill synopsys Properties... SMODEL_ 
a din ma nbd | theses PMAME! 


图 4-11 ”选择 openmips_min_sopc_tb 作 为 仿真 对 象 


在 出 现 的 波形 显示 界面 中 ， 添 加 要 观察 的 信号 ， 即 可 开始 仿真 。 此 处 
我 们 选择 寄存 器 $1-$4 作 为 观察 对 象 ， 如 图 4-12 所 示 ， 通 过 观察 寄存 器 
$1-$4 的 最 终 值 ， 可 知 OpenMIPS 正 确 执行 了 测试 程序 ， 也 就 是 正确 实现 了 


ori 指 令 。 


(2) regs[] 就 是 $1， 最 终 值 是 0x1100 (3)regs[2] 就 是 $2， 最 终 值 是 0x0020 | 

® ck sto kJ el po] N, | 

® rst sto 

Als rom_ce_o sti 
Eb if_inst 100... \ 
5-4 regfilet/regs[1] ]000... {00001100 n 
14 reofle1/reos[2] |000... au S 
5-4 reafile1/regs[3] |000... Tooofpe 
1-4 regfile1/regs[4] |oooofffi == (0000 


PE 


(1) if inst 是 取 到 的 指令 ， 从 (4) regs[3] 就 是 $S3， 最 终 信和 是 0xff00 上 
仿真 可 知 ， 依 次 取出 
inst_rom.data 中 的 指令 


图 4-12 ”从 仿真 结果 可 知 OpenMIPS 正 确实 现 了 ori 指 令 


(5) regs[4] 就 是 4， 最 终 值 是 0xffff 


添加 更 多 要 观察 的 信号 ， 可 以 了 解 流水 线 执行 情况 ， 如 图 4-13 所 示 。 
为 了 使 流水 线 情况 显示 得 更 加 直观 ， 此 处 以 第 一 条 指令 在 流水 线 中 的 执行 
过 程 为 例 ， 并 且 图 中 去 掉 了 其 他 指令 执行 时 引起 的 信号 变化 。 


执行 访 存 回 写 
de dk sto ~] | Lf LSJ 
® rst sto 
Al; rom_ce_o Stl 

54 if_ido/if_inst XXX... 
3-4: if idofid_pc 000... 
5-45 if_idO/id_inst JOG... 
ls idO/wreg_o 0 
54% ido/wd_o xx 
Ee idO/regi_o 000... 00000000 
2% idO/reg2_o 000... 
E- id0/alusel_o 0 1 | 
Ee id0/aluop_o 00 00100101 
Ss ex0/wreg_o 0 1 
EA ex0/wd_o Xx 01 
3% ex0/wdata_o 000... 00001100 
4% memü/wreg_o 0 1 
3% mem0/wd_o XX 1 
E- mem0/wdata_o 000... 0001100 
& mem_wb0/wb_wreg f0 1 
Eà mem_wb0/wb_wd xx 1 
Eà mem_wb0/wb_wdata 000... 0001100 
E-e reafile1/regs[1] 000... {00001100 _ 


图 4-13 ”通过 观察 第 一 条 指令 的 执行 过 程 ， 判 断 OpenMIPS 五 级 流水 线 是 否 正确 实现 


(1) 在 复位 结束 后 的 第 一 个 时 钟 周 期 上 升 沿 ，rom_ce_o 变 为 
ChipEnable， 表 示 指 令 存 储 器 使 能 ， 开 始 取 指 ， 进 入 取 指 阶段 ， 从 指令 存 
储 器 中 取出 第 一 条 指 SR ESTE DARA AA tis if_insto F 
一 个 时 钟 周期 ， 第 一 条 指令 进入 译 码 阶段 。 


(2) 观察 译 码 阶段 


。 此 时 译 码 阶段 的 指令 id_inst 正 是 第 一 条 指令 0x34011100。 

。 指令 地 址 id_pc 是 0x00000000。 

。 在 ID 模块 对 指令 进行 译 码 ， 得 到 指令 运算 类 型 alusel _o 是 3b001， 
查询 defines.h 文 件 中 的 宏 定义 可 知 ， 对 应 宏 EXE_RES_LOGIC， 
表示 是 逻辑 运算 。 


得 到 运算 子 类 型 aluop_o 是 8'b00100101， 查 询 defines.h 文 件 中 的 宏 

定义 可 知 ， 对 应 宏 RXE_OR_OP， 表 示 逻 辑 * 或 “运算 。 

译 码 得 到 参与 运算 的 源 操 作 数 1 是 0x00000000， 正 是 $0 寄 存 器 的 

值 。 

。 译 码 得 到 参与 运算 的 源 操作 数 2 是 0x00001100， 正 是 指令 中 立即 
数 零 扩展 后 的 值 。 

。 译 码 得 到 wreg_o 的 值 为 1， 表 示 要 写 目 的 寄存 器 。 

。 译 码 得 到 要 写 入 的 目的 寄存 器 wd_o 是 5b00001， 正 是 $1 寄 存 器 。 


(3) 观察 执行 阶段 


。 进行 指定 的 运算 ， 得 到 wdata_o 为 0x00001100， 就 是 要 写 到 目的 
寄存 器 的 数据 。 

传递 译 码 阶段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 

传递 译 码 阶段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 器 
是 $1 寄存 器 。 


(4) 观察 访 存 阶段 


。 传递 执行 阶段 wdata_o 的 值 ， 为 0x00001100 ， 表 示 要 写 到 目的 寄 
存 器 的 数据 。 

。 传递 执行 阶段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 

。 传递 执行 阶段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 器 
是 $1 寄存 器 。 


(5) 观察 回 写 阶段 


。 得 到 访 存 阶段 wdata_o 的 值 ， 为 0x00001100， 表 示 要 写 到 目的 寄 
存 器 的 数据 。 
e 得 到 访 存 阶 段 wreg_o 的 值 ， 为 1， 表 示 要 写 目 的 寄存 器 。 


。 得 到 访 存 阶 段 wd_o 的 值 ， 为 5b00001， 表 示 要 写 入 的 目的 寄存 器 
是 $1 寄 存 器 。 


在 回 写 阶段 的 最 后 ， 将 按照 要 求 写 目的 寄存 器 $1 ， 使 得 $1 的 值 为 
0x00001100。 通 过 上 面 的 观察 ， 可 知 原始 的 OpenMIPS 五 级 流水 线 实现 正 
确 。 接 下 来 ， 我 们 就 可 以 以 此 为 基础 ， 不 断 充实 ， 添 加 实现 更 多 的 MIPS 指 
令 ， 不 过， 在 此 之 前 ， 我 们 要 先 学 习 使 用 GNU 工 具 链 ， 本 节 的 例子 只 
条 指令 ， 可 以 手工 编译 ， 以 后 会 遇 到 比较 复杂 ， 拥 有 较 多 指令 的 程序 ， 
时 ， 手 工 编译 就 显得 效率 低下 了 ， 所 以 要 使 用 GNU 工 具 链 。 


4.4 MIPS 编 译 环境 的 建立 


OpenMIPS 处 理 器 在 设计 的 时 候 就 计划 与 MIPS32 指 令 集 架构 兼容 ， 所 
以 可 以 使 用 MIPS32 架 构 下 已 有 的 GNU 开 发 工具 链 。 本 节 将 说 明 如 何 安装 
使 用 GNU 开 发 工具 链 以 及 如 何 制 作 Makefile 文 件 ， 从 而 以 更 加 方便 、 快 
捷 、 自 动 的 方式 对 测试 程序 进行 编译 ， 并 得 到 指令 存储 器 ROM 的 初始 化 文 


件 inst_rom.datao 


4.4.1 VisualBox 的 安装 与 设置 


GNU 工 具 链 要 安装 在 Linux 环 境 下 ， 大 多 数 读 者 使 用 的 可 能 都 是 
Windows 平 台 ， 可 以 首先 安装 Linux 虚 拟 机 ， 再 在 Linux 虚 拟 机 中 安装 GNU 
工具 链 。 笔 者 推荐 使 用 OpenCores 站 点 上 提供 的 一 个 Linux 虚 拟 机 镜像 ， 该 
虚拟 机 预 装 的 是 Ubuntu 系统 。 


在 浏览 器 中 输入 地 址 : ftp://openrisc.opencores.org/virtualbox-image/ , 
FTP 的 用 户 名 和 密码 都 是 openrisc， 登 录 后 会 出 现 如 图 4-14 所 示 界 面 。 


e opencores. org 


ve WM (Art AR /virtualbox-image/ 位 于 openrise... 


FTP 目录 /virtualbox-image/ 位 于 openrisc. opencores. org 


BEE Windows 资源 管理 器 中 查看 此 FTP 站 点 ， 请 单 击 “ 页 面 ”， 然 后 单 击 “ 在 Windows RAE HIT FIP”. 
转 到 高 层 目录 

11/18/2011 12:00 上 午 1, 079, 277, 665 OpenRISC_Ubuntu_ 2011-11-18. vdi. bz2 

11/28/2011 12:00 上 午 1, 079, 338, 129 OpenRISC_Ubuntu_ 2011-11-28. vdi.bz2 


12/15/2011 12:00E4F 1, 149, 072, 789 OpenRISC Ubuntu 2011-12-15. vdi. bz2 
| 12/06/2011 12:00 LF 346, 810 orpsoc. rbf 


图 4-14 ”Ubuntu 虚拟 机 镜像 下 载 


下 载 最 新 的 那个 文件 就 可 以 了 ， 笔 者 使 用 的 是 2011-12-15 版 。 下 载 完 
成 后 解压 该 文件 ， 大 约 4GB 左 右 。 此 时 还 需要 下 载 VisualBox 才 可 以 打开 该 
文件 。VisualBox 是 一 款 开 源 的 虚拟 机 软件 ， 本 书 使 用 的 是 4.1.22 版 。 下 载 
完成 后 安装 VisualBox， 安 装 完 成 后 打开 VisualBox， 界 面 如 图 4-15 所 示 。 


© Oracle VE VirtualBox PH 
SEO ela) aa 


m, 
5 


|) 明 0) 
HEN KES Bact) 清除 


欢迎 使 用 虚拟 电脑 控制 台 ! 
A en 现在 是 空 的 ,因为 你 还 没有 新 建 任何 虚拟 电 
Bl. É 


ENE ME, EMPORIO 
建 按钮 。 


你 可 以 按 ?1 键 来 查看 和 帮助， 或 访问 
www. virtualbox. org 查看 最 新 信息 和 新 闻 . 


图 4-15 ”VisualBox 主 界面 


单 击 “ 新 建 " 按 钮 出 现 “ 新 建 虚拟 机 ”向 导 ， 单 击 “ 下 一 步 * 按 钮 ， 出 现 如 
图 4-16 所 示 界 面 。 


虚拟 电脑 名 称 和 系统 类 型 
PREDIO DE EI LISA ES 


每 个 虚拟 电脑 都 要 有 一 个 唯一 的 名 称 来 标识 ， 用 来 区 分 该 虚拟 电脑 的 硬件 配置 和 


上 面 的 系统 、 软 件 和 数据 。 
BMA) 


OpenMIPS_Vbuntul 

系统 类 型 位 ) 

操作 系统 (E): Linux 
SRA): Ubuntu 


(oe 


图 4-16 新建 虚拟 机 设置 一 


此 处 操作 系统 选择 Linux， 版 本 选择 Ubuntu， 设 置 内 存 大 小 ， 单 击 下 


一 步 按钮 > 40 图 4-17 所 示 。 


内 存 


指定 虚拟 电脑 可 用 内 存 大 小 ,单位 为 : MB. 
建议 分 配 的 内 存 太 小 是 512 MBa 


内 存 大 小 Ww) 


3584 MB 


i 


图 4-17 新 建 虚拟 机 设置 二 


内 存 大 小 依据 计算 机 情况 设置 ， 笔 者 设置 的 是 512MB， 已 经 够 用 了 ， 
毕竟 我 们 需要 编译 的 程序 都 是 十 分 简单 的 ， 单 击 下 一 步 按 钮 ， 选 择 “ 使 用 


现 有 的 虚拟 硬盘 ”"， 然 后 选择 解压 后 的 虚拟 机 文件 ， 如 图 4-18 所 示 。 


TY 新 建 虚拟 电脑 


se BE EE 


你 可 以 现在 添加 启动 盘 到 虚拟 电脑 中 。 Re 或 从 列表 中 
选择 一 个 ,也 可 以 点 交 件 夹 图 标 从 其 地 位 置 选 择 


de :您 可 以 跳 过 此 步 又 ,在 创建 虚拟 电脑 后 再 更 改 


启动 磁盘 的 推荐 大 小 为 8.00 GB. 
O 创建 新 的 虚拟 硬盘 C) 
© 使 用 现 有 的 虚拟 硬盘 U) 


OpenRISC_Vbuntu_2011-12-15.vdi (BiB, 40.00 GB) v 


图 4-18 新建 虚 拟 机 设置 三 


单 击 “ 下 一 步 ” 按 钮 ，VisualBox 会 将 用 户 刚 才 的 设置 都 列 出 来 ， 确 认 无 
误 后 ， 单 击 “ 创 建 "按钮 ， 这 样 虚拟 机 就 创建 好 了 。 启 动 虚拟 机 ，Ubuntu 虚 


拟 机 桌面 显示 如 图 4-19 所 示 。 


Ger Started ccc rise) SUR ins Eg TREE VirtualBox image 


oa Era. dayalgyınane TREE update info 
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图 4-19 ”Ubuntu 虚拟 机 桌面 


至 此 Linux 虚 拟 机 就 已 经 安装 好 了 ， 还 需要 多 做 一 步 工 作 ， 就 是 设置 
eee eS 这 样 方便 以 后 在 两 个 系统 之 间 传 递 
文件 。 先 关闭 Ubuntu 虚拟 机 ， 然 后 打开 VisualBox 中 虚拟 机 的 设置 界面 ， 选 
择 “ 共 享 文件 夹 "选项 ， 如 图 4-20 所 示 。 


% OpenNIPS - 设置 


共享 文件 夹 


共享 文件 夹 列表 E) 
自动 持 载 “访问 权限 B 


VSB 设备 
共享 文件 来 


g 
: 
(e) 
bo 
eP 
分 
2 


列 出 本 虚拟 电脑 可 访问 的 所 有 共享 净 件 夹 。 使 用 “net use x: \ivboxsvrishare’ 从 D03 或 
Windows PISA: share 的 共享 交 件 来， 或 使 用 ‘mount -t vboxsf share 
mount_point’ 从 Linux 类 的 操作 系统 中 访问 该 文件 来 。 “该 功 能 需要 在 谍 拟 电脑 中 安装 增强 功 


能 包 。 
= [m 


图 4-20 虚拟 机 与 宿主 机 共享 文件 夹 设置 步 又 一 
单 击 界面 右边 的 添加 文件 夹 按 钮 ， 出 现 如 图 4-21 所 示 的 界面 。 


% 编辑 共享 文件 夫 


HS WERE: | F: \WbuntuShareF older 


共享 交 件 夹 名 称 : UbuntuShareFol der 
O RSE R) 


O 自动 挂 载 a) 


图 4-21 虚拟 机 与 宿主 机 共享 文件 夹 设置 步骤 二 


在 其 中 选择 共享 文件 夹 的 路 径 ， 设 置 名 称 ， 参 考 图 4-21 所 示 设 置 。 设 
置 完成 后 ， 可 以 启动 虚拟 机 ， 打 开 终端 ， 输 入 命令 : 


sudo mount -t vboxsf UbuntuShareFolder /mnt/ 


该 命令 的 作用 是 将 共享 文件 夹 挂 载 在 /mnt/ 目 录 下 ，sudo 表 示 以 Root 用 
户 身份 执行 该 命令 ， 终 端 会 提示 输入 密码 ，Ubuntu 虚 拟 机 默认 Root 用 户 的 
密码 是 openrisc。 这 样 就 实现 了 虚拟 机 与 宿主 机 的 文件 共享 ， 对 虚拟 机 而 
言 共 享 文件 放 在 /mnt/ 路 径 下 ， 对 宿主 机 而 言 共享 文件 放 在 图 4-21 所 示 的 F 
盘 UbuntuShareFolder 文 件 夹 下 。 


442 GNU 工具 链 的 安装 


在 本 书 附带 光盘 的 tools 目 录 下 提供 了 GNU 工 具 链 安装 文件 ， 文 件 名 是 
mips-sde-elf- i686-pc-linux-gnu.tar.tar， 将 该 文件 复制 到 4.4.1 节 设置 的 共享 
文件 夹 下 ， 即 可 通过 Ubuntu 虚 拟 机 访问 该 文件 。 将 安装 文件 复制 到 Ubuntu 
的 /opt 目 录 下 ， 打 开 Ubuntu 的 终端 ， 使 用 如 下 命令 解压 缩 : 


cd /opt 


tar vfxj mips-sde-elf-i686-pc-linux-gnu.tar.tar 


然后 打开 用 户主 目录 Home 文 件 夹 ， 在 窗口 菜单 栏 中 选择 View->Show 
Hidden Files， 以 显示 所 有 文件 ， 这 样 可 以 找到 一 个 隐藏 文件 .bashrc， 在 此 
文件 的 最 后 加 入 PATH 的 设置 ， 如 下 。 


export PATH="$PATH:/opt/mips-4.3/bin” 


重新 启动 Ubuntu 系统 。 


重启 后 ， 打 开 终 端 ， 在 其 中 输入 mips-sde-elf-， 然 后 按 两 次 Tab 键 ， 会 
列 出 刚刚 安装 的 针对 MIPS 平 台 的 所 有 编译 工具 ， 如 图 4-22 所 示 ， 表 示 GNU 
工具 链 安 装 成 功 。 


Xx openmips@openmips-VM: /opt 


openmips@openmips-VM:/opt$ mips-sde-elf- 


mips-sde-elf-addr2line mips-sde-elf-gcc mips-sde-elf-objcopy 
mips-sde-elf-ar mips-sde-elf-gcc-4.3.2 mips-sde-elf-objdump 
mips-sde-elf-as mips-sde-elf-gcov mips-sde-elf-ranlib 
mips-sde-elf-c++ mips-sde-elf-gdb mips-sde-elf-readelf 
mips-sde-elf-c++filt mips-sde-elf-gdbtui mips-sde-elf-run 
mips-sde-elf-conv mips-sde-elf-gprof nen 
mips-sde-elf-cpp mips-sde-elf-ld mips-sde-elf-sthings 
mips-sde-elf-g++ mips-sde-elf-nm mips-sde-elf-strip 


openmips@openmips-VM: /opt$ mips-sde-elf- 


4-22 ”Ubuntu 中 安装 的 编译 工具 


GNU 工 具 链 包含 很 多 工具 ， 但 我 们 使 用 得 不 多 ， 主 要 的 几 个 工具 如 
Fo 此 处 使 用 的 是 通 BAS, 针对 MIPS 平 台 的 工具 ， 会 在 名 称 前 增加 “mips- 


sde-elf-” 前 缀 。 


e as: GNU 汇 编 器 ， 通 常 也 称 为 GAS (GNU Assembler), ，as 对 汇编 
源 程序 进行 编译 产生 目标 文件 。 

e ld: GNU 链 接 器 ，as 产 生 的 目标 文件 需要 由 ld 进行 链接 、 重 定位 
数据 产生 可 执行 文件 。 

。 objcopy: 用 于 将 一 种 格式 的 目标 文件 复制 成 另外 一 种 格式 。 

。 objdump: 用 于 列 出 关于 二 进 制 文件 的 各 种 信息 。 

。 readelf: 类 似 于 objdump， 但 是 它 只 能 处 理 ELF 格 式 的 文件 。 


4.4.3 ”使 用 GNU 工 具 进 行 编译 


本 小 节 就 使 用 GNU 工 具 编 译 4.3 节 的 测试 程序 。 首 先 在 Ubuntu 虚 拟 机 
中 新 建 一 个 文件 ， 文 件 名 为 inst_rom.S， 内 容 如 下 。 相 比 4.3 节 的 测试 程 
序 ， 多 了 三 条 编译 指导 语句 。 


‚org 0x0 // 指示 程序 从 地 址 9x0 开 始 
.global _start // 定义 一 个 全 局 符号 _start 


.Set noat // 允许 自由 使 用 寄存 器 $1 

_start: 
ori $1, $0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
ori $2, $0,0x0020 # $2 = $0 | 0x0020 = 0x0020 
ori $3,$0,0xff00 # $3 = $0 | Oxff00 = OXff00 
ori $4,$0,0xffff H $4 = $0 | oxffff = Oxffff 


对 “set noat” 做 进一步 说 明 ， 这 是 一 个 汇编 控制 伪 操 作 。 在 第 1 章 介 
MIPS32 架 构 中 的 通用 寄存 器 时 已 经 提 e r all 
名 称 ， 其 用 法 也 遵循 一 些 约定 ， 比 如 : 寄存 器 $1， 编 程 时 的 约定 名 称 为 
at， 一 般 留 给 汇编 器 使 用 ， 程 序 中 不 直接 使 用 。 如 果 直 接 使 用 ， 汇 编 器 会 
发 出 警告 ， 此 处 设置 “set noat”" 就 是 表示 可 以 自由 使 用 寄存 器 $1， 汇 编 器 不 
会 发 出 警告 。 


在 Ubuntu 中 打开 终端 ， 使 用 cd 命令 将 路 径 调 整 eee rom.S 所 在 目 
录 ， 然 后 使 用 如 下 命令 编译 代码 。 其 中 添加 了 “-mips32” 选 项 ， 表 示 按 照 
MIPS32 指 令 集 架构 进行 编译 。 


mips-sde-elf-as -mips32 inst_rom.S -o inst_rom.o 


上 述 命令 会 得 到 目标 代码 inst_rom.0o。 打 开 inst_rom.o 文 件 ， 可 以 发 现 
其 最 初 的 四 个 字 节 是 : 0x7F、0x45、0x4C、0x46， 这 说 明 inst_rom.o 是 一 
个 ELF 文 件 ， 如 图 4-23 所 示 。 


4 6 0 9 = h d = 
00000000h: BE 01 02 01 00 00 00 00 00 00 00 00 00 : 
0100/0052 oo or 000g o0 00 00 OT DOU 00 H0 0p Oey A anne 
00000020h: oo 00 00 98 50 00 00 00 00 34 00 00 00 00 00 28 ; .......4..... { 
(olo(afufofuicial ia gorgs 00 fake ice lok sóla sey la ae) eS (ake Bele) ano see 


图 4-23 inst_rom.o 的 开始 部 分 


为 了 便于 读者 理解 ， 下 面 将 简单 介绍 一 下 ELF 文 件 ， 读 者 朋友 如 果 对 
这 不 感 兴趣 或 者 希望 尽快 了 解 编译 链接 过 程 的 可 以 跳 过 下 面 的 介绍 ， 直 接 
阅读 4.4.4 节 。 


ELF (Executable and Linkable Format) 可 执行 链接 格式 ， 是 UNIX 系 
统 实验 室 (USL) 作为 应 用 程序 二 进 制 接 口 (Application Binary 
Interface, ABI) 而 开发 和 发 布 的 。ELF 目 标 文 件 有 三 种 类 型 。 


(1) 可 重 定位 (Relocatable) X: 保存 着 代码 和 适当 的 数据 ， 用 来 
和 其 他 Object 文件 一 起 创建 一 个 可 执行 文件 或 共享 文件 。 


(2) 可 执行 (Executable) 文件 : 保存 着 一 个 用 来 执行 的 程序 ， 该 文 
件 指 出 了 如 何 来 创建 程序 进程 映 象 。 


(3) 共享 目标 文件 : 包含 了 在 两 种 使 用 环境 中 链接 的 代码 和 数据 。 
首先 链接 器 (ld) 可 以 将 它 和 其 余 可 重 定位 文件 和 共享 目标 文件 一 起 处 
理 ， 生 成 另外 一 个 目标 文件 〈 比 如: 编译 器 和 链接 器 把 *.o 和 *.so 一 起 装配 
成 一 个 *.exe 文 件 ) 。 其 次 ， 动 态 链接 器 (Dynamic Linker) 可 将 它 与 某 个 
可 执行 文件 以 及 其 他 共享 目标 文件 组 合 在 一 起 创建 进程 映像 〈 比 如 : 动态 
加 载 器 把 *.exe 程 序 和 *.so 加 载 进 内 存 执行 ) 。 


无 论 何 种 类 型 的 ELF 文 件 ， 其 结构 都 是 相同 的 。ELF 文 件 由 四 部 分 组 
成 : ELF header、Program header table、 Sections、 Section header table。 其 
最 开始 的 部 分 就 是 ELF header， 定 义 如 下 : 


#define EI_NIDENT 16 
typedef struct{ 
unsigned char e_ident[EI_NIDENT]; // 占 用 16 个 字 节 
Elf32_Half e_type; //El1f32_Half 表 示 是 2 个 字 
节 大 小 


节 大 小 


节 大 小 


节 大 小 


E1f32_ Half 
Elf32 word 


Elf32_Addr 


Elf32_off 


Elf32_Off 

Elf32_Word 
Elf32_Half 
Elf32_Half 
Elf32_Half 
Elf32_Half 
Elf32_Half 
Elf32_Half 


}ELF32_Ehdr; 


开始 四 个 


Sa El 


+ TE 


e_machine; 


e_version; 


e_entry; 


e_phoff; 


e_shoff; 


e_flags; 


e_ehsize; 


e_phentsize; 


e_phnum; 


e_shentsize; 


e_shnum; 


e_shstrndx; 


/VE1f32_Word 表 示 是 4 个 字 


//El1f32_addr 也 表示 4 个 字 


//Elf32_0ff 也 表示 4 个 字 


固定 不 变 的 : 0x7F， 紧 接着 是 ELF 三 个 字符 的 ASCII 


码 ， 这 四 个 字 节 表明 这 个 文件 是 一 个 ELF 文 件 。 此 处 以 inst_rom.o 为 例 ， 介 


绍 e_ident 字 段 后 面 字 节 的 含义 ， 参 考 图 4-23。 


° e_type 是 01 》 表示 是 可 重 定位 文件 。 


。 e_machine 表 示 运 行 该 程序 需要 的 体系 结构 ， 此 处 为 0x08， 表 示 


MIPS R3000。 
e e_vVersion 表 示 文 件 版 本 ， 此 处 是 1。 
。e_entry 表 示 程 序 的 入 口 地 址 ， 此 处 是 0x0。 


。e_phoff 是 Program header table 在 文件 中 的 偏 移 量 (US Rit 


数 ) ， 此 处 是 0x0。 


e e shoffí3 Section header table 在 文件 中 的 偏 移 量 〈 以 字 节 计数 ) ， 
此 处 为 0x98。 

e e flags 为 保存 着 相关 文件 的 特定 处 理 器 信息 ， 此 处 为 
0x50000000， 表 示 MIPS32。 

e e_ehsize 表 示 ELF header 的 大 小 ， 此 处 为 0x34。 

e e_phentsize #7 Program header table 中 每 一 个 条 目 (一 个 Program 
header) 的 大 小 ， 此 处 为 0x0。 

。e_phnum 表 示 Program header table 中 有 多 少 个 条 目 ， 此 处 为 0。 

e e_shensize 表示 Section header table 中 每 一 个 条 目 (— Section 
header) 的 大 小 ， 此 处 为 0x28。 

e e_shnum 表 示 Section header table 中 有 多 少 个 条 目 ， 此 处 为 0x09。 

e e_shstrndx 保 存 着 字符 表 相 关 入 口 的 节 区 头 部 表 索 引 ， 此 处 为 
Ox06o 


通过 上 述 解释 可 以 了 解 到 这 个 文件 是 一 个 可 重 定 位 (Relocatable) X 
件 ， 不 是 可 执行 文件 ， 同 时 了 解 到 该 文件 包含 的 Program header table, 
Section header table 信 息 。 对 inst_rom.o 而 言 ， 没 有 Program header table. + 
照 给 出 的 偏 移 信 息 ， 我 们 可 以 得 到 Section header table 表 的 位 置 ， 通 过 
Section header table 得 到 每 个 Section 的 位 置 。 


当然 ， 按 照 ELF header 的 内 容 以 及 Section header table， 我 们 可 以 按 图 
索 戏 地 分 析 所 有 Section， 但 是 这 样 做 效率 太 低 ， 借 助 于 GNU 工 具 链 中 的 
mips-sde-elf-readelf， 我 们 可 以 直接 得 到 Section 信 息 ， 如 图 4-24 所 示 。 


mips-sde-elf-readelf -S inst_rom.o 


There are 9 section headers, starting at offset 0x98: 


Section Headers: 


[Nr] Name Type 

[ 0] NULL 

[ 1] .text PROGBITS 

[ 2] .data PROGBITS 

[ 3] .bss NOBITS 

[ 4] .reginfo MIPS_REGINFO 

[ 5] .pdr PROGBITS 

[ 6] .shstrtab STRTAB 

[ 7] .symtab SYMTAB 

[ 8] .strtab STRTAB 
Key to Flags: 

W 

I 

0 


Addr 

00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 


(write), A (alloc), X (execute), M (merge), S 
(info), L (link order), G (group), x (unknown) 
(extra OS processing required) o (OS specific), p (processor specific) 


` 


off Size ES 
000000 000000 00 
000034 000010 00 
000044 000000 00 
000044 000000 00 
000044 000018 18 
00005c 000000 00 
00005c 00003a 00 
000200 000070 10 
000270 000008 00 


(strings) 


图 4-24 利用 工具 mips-sde-elf-readelf 可 以 得 到 所 有 的 Section 信 息 


注意 添加 “-S” 选 项 。 这 里 列 出 了 9 个 Section 的 信息 ， 
这 个 Section， 它 的 起 始 地 址 是 0x34， 长 度 是 0x10， 我 们 列 出 这 个 Section 的 


内 容 如 图 4-25 所 示 。 


Flg Lk Inf AL 
9 9 


o 


AX 
WA 
WA 


ovoooooo 
onoooooo 
Papa a 


注意 其 中 的 “.text” 


00000030h: 00 09 DD 06 ECM IA AI IES 


00000040h: Euer OO 00 00 1E OO 00 00 00 00 00 00 00 


图 4-25 Section .text 的 内 容 


参考 4.3.3 节 可 知 ， 这 0x10 个 字 节 正 是 测试 程序 中 的 4 条 指令 对 应 的 二 


进 制 数字 。 


4.4.4 ”使 用 GNU 工 具 进 行 链接 


通过 编译 得 到 了 一 个 可 重 定位 ELF 文 件 ， 但 这 个 文件 还 不 能 执行 ， 需 
要 通过 链接 转化 为 可 执行 文件 ， 然 后 才能 执行 。 使 用 链接 工具 mips-sde-elf- 
ld 完成 这 项 工作 ， 在 mips-sde-elf-ld 的 参数 中 需要 声明 一 个 链接 描述 脚本 ， 
链接 描述 脚本 描述 了 输入 文件 的 各 个 Section 如 何 映射 到 输出 文件 的 各 个 
Section 中 ， 并 控制 输出 文件 中 Section 和 符号 的 内 存 布局 。 可 以 通过 新 建 一 
个 Document 作 为 链接 描述 脚本 ， 文 件 名 为 ram.1d， 内 容 如 下 。 


其 中 定义 了 一 个 存储 块 一 ram， 其 起 始 地 址 是 0x0， 长 度 是 0x1000， 
然后 指示 链接 器 输出 文件 包含 三 个 Section， 分 别 是 .text、.data、.bss， 其 
中 .text 从 ram 的 起 始 地 址 开始 存放 ， 后 面 跟着 .data、.bss， 并 且 输 入 文件 的 


Section .text 存 放 在 输出 文件 的 .text 中 ， 输 入 文件 的 Section .data 存 放 在 输出 
文件 的 .data 中 ， 输 入 文件 的 Section .bss 存 放 在 输出 文件 的 .bss 中 。 最 后 的 
Entry 指 定 程 序 的 入 口 地 址 ， 也 就 是 第 一 条 执行 的 指令 地 址 是 _start 符 号 的 
值 ， 从 汇编 代码 中 可 知 _start 符 号 就 是 0x0。 现 在 就 可 以 使 用 链接 器 了 E 
Ubuntu 虚拟 机 的 终端 中 输入 如 下 命令 。 


mips-sde-elf-1d -T ram.ld inst_rom.o -o inst_rom.om 


得 到 链接 后 的 文件 inst_rom.om， 这 也 是 一 个 ELF 格 式 的 文件 ， 其 ELF 
header 如 图 4-26 所 示 。 


00000000h: MAREAS 01 02 01 00 00 00 00 00 00 00 00 00 ; 

ODB00B010R71907027007087005002005037 on OO 0/00 a s nan i AO oo 4 
00000020h: 00 01 00 54 50 00 00 00 00 34 00 20 00 01 00 28 ; ...TP....4. af 
00000030: 00 06 00 03 00 00 00 01 00 01 00 00 00 00 OO 00 2 oes 


图 4-26 inst_rom.omBYELF header 


上 一 小 节 是 手工 分 析 inst_rom.o 的 ELF header， 主 要 是 为 了 帮助 读者 理 
解 ， 其 实 可 以 直接 使 用 工具 分 析 ELF header， 在 终端 中 输入 如 下 命令 将 自 
动 分 析 inst_rom.om 的 ELF header. 


mips-sde-elf-readelf -h inst_rom.om 


其 中 加 上 参数 “-h” 表 示 只 读 取 ELF header， 得 到 结果 如 图 4-27 所 示 。 


mips-sde-elf-readelf -h inst _rom.om 
ELF Header: 


Magic: 7f 45 4c 46 01 02 01 00 00 00 00 00 00 00 00 00 


Class: ELF32 

Data: 2's complement, big endian 
Version: 1 (current) 

OS/ABI: UNIX - System V 

ABI Version: 0 

Type: EXEC (Executable file) 
Machine: MIPS R3000 

Version: 0x1 

Entry point address: 0x0 

Start of program headers: 52 (bytes into file) 
Start of section headers: 65620 (bytes into file) 
Flags: 0x50000000, mips32 

Size of this header: 52 (bytes) 

Size of program headers: 32 (bytes) 

Number of program headers: 1 

Size of section headers: 40 (bytes) 

Number of section headers: 6 


Section header string table index: 3 


图 4-27 inst_rom.omBYELF header 信 息 


从 图 4-27 中 可 知 inst_rom.om 是 一 个 可 执行 文件 。 读 者 朋友 也 许 已 经 注 
意 到 了 ，inst_rom.om 上 binst_rom.0o 多 了 Program header， 而 这 在 inst_rom.o 里 
面 是 没有 的 ， 与 Section header 一 样 ，Program header 也 可 以 使 用 一 个 结构 体 
描述 ， 如 下 。 


typedef struct{ 


Elf32_Word p_type; 

Elf32_Off p_offset; 
E1f32_Addr p_vaddr; 
Elf32_Addr p_paddr; 
E1f32_Word p_filez; 
Elf32_Word p_memsz; 
Elf32_Word p_flags; 
Elf32_Word p_align; 


}E1f32_Phdr; 


我 们 还 是 使 用 工具 mips-sde-elf-readelf 从 inst_rom.om 中 分 析出 一 个 
Program header， 然 后 结合 这 个 Program header 解 释 上 面 各 个 各 项 的 含义 。 
使 用 如 下 命令 得 到 Program header 的 信息 。 


mips-sde-elf-readelf -1 inst_rom.om 


其 中 加 上 “-]* 参 数 ， 表 示 列 出 Program header 的 信息 ， 显 示 如 图 4-28 所 
Ro 
mips-sde-elf-readelf -L inst_rom.om 


Elf file type is EXEC (Executable file) 
Entry point 0x0 
There are 1 program headers, starting at offset 52 


Program Headers: 
Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align 
LOAD 0x010000 0x00000000 0x00000000 0x00010 0x00010 R E 0x10000 


图 4-28 Program header 信 息 
借助 上 图 介绍 Program header 各 个 字段 的 含义 : 


。p_type 为 LOAD， 表 示 可 加 载 。 

e p_offset 表 示 段 的 第 一 个 字 节 在 文件 inst_rom.om 中 的 偏 移 ， 此 处 
为 0x10000。 

e p_vaddr 表 示 段 的 第 一 个 字 节 在 内 存 中 地 址 ， 此 处 为 0。 

。p_paddr 为 0， 人 在 物理 地 址 定位 有 关联 的 系统 中 ， 该 成 员 是 为 该 段 
的 物理 地 址 而 保留 的 。 

e p_filez 表 示 段 在 文件 中 的 长 度 ， 此 处 为 0x10。 

e p_memsz 表 示 段 在 内 存 中 的 长 度 ， 此 处 为 0x10。 

。p_flags 为 RE， 表 示 可 读 、 可 执行 。 

。p_align 为 0x10000， 根 据 此 项 确定 段 在 文件 以 及 内 存 中 如 何 对 
E 


Jlo 


1% Program header 表 示 将 inst_rom.om 文 件 中 从 偏 移 0x10000 开 始 的 0x10 
个 字 节 放置 在 内 存 的 0x0 处 ， 打 开 inst_rom.om 可 以 发 现 从 偏 移 0x10000 开 始 
的 0x10 个 字 节 的 内 容 与 inst_rom.o 中 Section .text 的 内 容 一 样 ， 所 以 当 这 个 
Program Section 加 载 入 内 存 后， 会 使 得 内 存 从 地 址 0x0 开 始 的 0x10 个 字 节 存 
放 的 就 是 测试 程序 的 4 条 指令 。 


分 析 到 这 里 ， 读 者 是 不 是 对 编译 、 链 接 过 程 有 了 比 之 前 更 深 的 了 解 ? 
其 实 这 些 背景 知识 与 OpenMIPS 处 理 器 关系 不 大 ， 但 是 知道 这 些 有 助 于 理 
解 编译 链接 的 过 程 。 总 结 一 下 ， 编 译 链接 的 过 程 很 简单 ， 只 需要 两 步 ， 如 
Fo 


编译 : mips-sde-elf-as -mips32 inst_rom.S -o inst_rom.o 


链接 : mips-sde-elf-1d -T ram.1d inst_rom.o -o inst_rom.om 


4.45 “得 到 ROM 初 始 化 文件 


4.4.4 节 得 到 的 inst_rom.om 是 一 个 ELF 格 式 的 可 执行 文件 ， 与 我 们 希望 
的 指令 存储 器 ROM 初 始 化 文件 inst_rom.data 的 格式 有 很 大 区 别 ， 需 要 进行 
格式 转化 。 在 GNU 工 具 链 中 提供 了 另 一 个 工具 mips-sde-elf-objcopy， 用 于 
将 一 种 格式 的 目标 文件 转化 成 另外 一 种 格式 。 在 这 里 ， 可 以 使 用 mips-sde- 
elf-objcopy 得 到 inst_rom.om 的 二 进 制 (Binary) 形式 ， 使 用 方法 如 下 。 人 得 
到 的 二 进 制 文件 inst_rom.bin 的 内 容 如 图 4-29 所 示 。 


mips-sde-elf-objcopy -0 binary inst_rom.om inst_rom.bin 


从 图 4-29 可 以 发 现 ，bin 文 件 的 内 容 正 是 测试 程序 中 4 条 指令 对 应 的 二 
进 制 字 ， 现 在 只 需要 编写 一 个 小 程序 将 bin 文 件 转化 为 ModelSim 中 存储 器 
初始 化 文件 的 格式 。 这 个 小 程序 很 简单 ， 此 处 不 再 列 出 代码 ， 在 本 书 附带 


的 光盘 中 可 以 找到 源 程 序 ， 程 序 名 为 Bin2Mem.exe， 使 用 方法 如 下 。 人 得 到 
的 inst_rom.data 文 件 如 图 4-30 所 示 。 


./Bin2Mem.exe -f inst_rom.bin -o inst_rom.data 


00000000h: 34 01 11 00 34 02 00 20 34 03 FF OO 34 04 FF a 


图 4-29 inst_rom.bin 文 件 的 内 容 


1 SZ To 
2 34020020 
3 S405[II00 
4 OS ae 


图 4-30 inst_rom.data 文 件 的 内 容 


好 了 ， 现 在 回忆 一 下 从 源 代 码 得 到 ModelSim 仿 真 时 可 以 使 用 的 指令 存 
储 器 ROM 初 始 化 文件 一 共 需 要 4 步 : 编译 、 链 接 、 得 到 bin 文 件 、 格 式 转 
化 ， 如 下 。 


编译 : mips-sde-elf-as -mips32 inst_rom.S -o inst_rom.o 
链接 : mips-sde-elf-1d -T ram.ld inst_rom.o -o inst_rom.om 
2 Al bin X #: mips-sde-elf-objcopy -0 binary inst_rom.om 


inst_rom.bin 


格式 转化 : ./Bin2Mem.exe -f inst_rom.bin -o inst_rom.data 


4.4.6 ”编写 Makefile 文 件 


为 了 得 到 指令 存储 器 初始 化 文件 ， 我 们 需要 输入 4 条 命令 ， 有 点 麻 
烦 ， 最 好 只 输入 一 条 命令 就 可 以 了 ， 这 需要 使 用 Makefile 文 件 。 在 汇编 程 
序 inst_rom.S 所 在 目录 下 新 建 一 个 Document， 文 件 名 为 Makefile， 内 容 如 
Ta 


inst_rom.bin: inst_rom.om 


$(OBJCOPY) -0 binary $< $0 


inst_rom.data: inst_rom.bin 


./Bin2Mem.exe -f $< -o $@ 


clean: 


rm -f *.o *.om *.bin *.data 


这 是 一 个 很 简单 的 Makefile， 借 助 于 它 介绍 Makefile 的 组 成 。Makefile 
的 前 半 部 分 是 一 些 变量 的 定义 ， 比 如 : 定义 CC 为 mips-sde-elf-as， 定 义 LD 
为 mips-sde-elf-1d4， 其 中 引用 了 预定 义 的 变量 CROSS_COMPILE。Makefile 
的 后 半 部 分 定义 了 多 个 目标 ， 有 all、clean 等 ， 采 用 的 语法 如 下 : 


目标 : 依赖 文件 


AA 
apy 


上 述 形式 表示 的 意思 是 : (1 要 想得到 <“ 目标 ”， 那 么 需要 执行 “ 命 
> (2) “目标 ”依赖 于 “依赖 文件 ”， 当 “依赖 文件 ”中 至 少 一 个 文件 比 *“ 目 
标 ” 文 件 新 时 , “命令 ” 才 被 执行 。 在 上 面 Makefile 的 “命令 ”中 使 用 了 
Makefile 一 些 预定 义 的 变量 ,含义 如 下 : 
$< 表示 第 一 个 依赖 文件 的 名 称 
$@ 表示 目标 的 完整 名 称 


所 以 上 述 Makefile 可 以 解读 如 下 : 


(1) 用 户 输入 make all， 要 求 得 到 目标 al， 目 标 al 的 依赖 文件 是 


inst_rom.data， 要 先 得 到 inst_rom.data。 


(2) 要 得 到 inst_rom.data， 需 要 依赖 文件 inst_rom.bin。 
(3) 要 得 到 inst_rom.bin， 需 要 依赖 文件 inst_rom.om。 


(4) 要 得 到 inst_rom.om， 需 要 依赖 文件 $(OBJECTS)， 其 中 OBJECTS 
是 预定 义 变量 ， 其 值 为 inst rom.o ， 所 以 此 处 就 是 需要 依赖 文件 


inst_rom.0o 


(5) 要 得 到 inst_rom.o， 需 要 依赖 文件 inst_rom.S， 该 文件 已 经 提供 ， 
满足 依赖 条 件 ， 所 以 会 执行 命令 $(CC) -mips $< -o $@， 实 际 就 是 如 下 命 


令 ， 执 行 后 得 到 inst_rom.o。 


mips-sde-elf-as -mips inst_rom.S -o inst_rom.o 


tn 


(6) 得 到 inst_rom.o 后 ， 满 足 了 目标 inst_rom.om 的 依赖 条 件 ， 所 以 可 
以 进一步 得 到 inst_rom.om， 通 过 执行 命令 $(LD) -T ram.ld $(OBJECTS) -o 


$@， 实 际 就 是 通过 如 下 命令 得 到 inst_rom.ome 


HN 


mip-sde-elf-1d -T ram.ld inst_rom.o -o inst_rom.om 


(7) 得 到 inst_rom.om 后 ， 满 足 了 目标 inst_rom.bin 的 依赖 条 件 ， 所 以 
可 以 进一步 得 到 inst_rom.bin， 通 过 执行 命令 $(OBJCOPY) -O binary $< 


$@， 实 际 就 是 通过 如 下 命令 得 到 inst_rom.bin。 
mip-sde-elf-objcopy -0 binary inst_rom.om inst_rom.bin 


(8) 得 到 inst_rom.bin 后 ， 满 足 了 目标 inst_rom.data 的 依赖 条 件 ， 所 以 
可 以 进一步 得 到 inst_rom.data， 通 过 执行 命令 /Bin2Mem.exe -f $< -o $@， 


实际 就 是 通过 如 下 命令 得 到 inst_rom.data。 


./Bin2Mem.exe -f inst_rom.bin -o inst_rom.data 


(9) 得 到 inst rom.data， 满 足 了 目标 all 的 依赖 条 件 ， 从 而 实现 目标 
allo 


有 了 Makefile 文 件 ， 我 们 在 终端 中 输入 “make all”* 就 可 以 完成 所 有 的 过 
程 了 。 


简单 总 结 一 下 从 测试 程序 得 到 指令 存储 器 ROM 初 始 化 文件 的 步骤 如 
下 。 


编写 源 代码 ， 当 然 是 汇编 代码 ， 文 件 名 为 inst_rom.S。 
复制 本 节 编 写 的 Makefile、Bin2Mem.exe、ram.ld 到 源 代 码 所 在 目 
录 。 

。 打开 终端 ， 路 径 调 整 到 产 代 码 所 在 目录 ， 输 入 “make all”. 


经 过 上 述 步 骤 ， 即 可 得 到 能 够 在 ModelSim 仿 真 中 使 用 的 指令 存储 器 
ROM 初 始 化 文件 inst_rom.datao 


最 后 ， 我 们 可 以 增加 一 步 ， 使 用 工具 mips-sde-elf-objdump 对 
inst_rom.om 进 行 反 汇编 ， 从 而 得 到 指令 与 其 二 进 制 字 的 对 应 。 如 下 。 


mips-sde-elf-objdump -D inst_rom.om > inst_rom.asm 


得 到 inst_rom.asm 文 件 ， 使 用 记事 本 打开 该 文件 ， 内 容 如 图 4-31 所 示 。 
重点 是 图 4-31 中 使 用 黑 框 包围 的 部 分 ， 其 对 应 的 就 是 测试 程序 的 4 条 指令 。 
每 一 行 分 为 三 列 : 左边 一 列 是 指令 地 址 ， 中 间 一 列 是 指令 对 应 的 二 进 制 
字 ， 右 边 是 汇编 指令 。 注 意 : 这 里 的 指令 进行 了 变化 ， 里 然 测 试 程序 都 是 
ori 指 令 ， 但 是 这 里 都 改 成 li 指令 ，li 是 汇编 指令 ，ori 是 机 器 指令 ， 两 者 是 相 
等 的 。 


li rt, immediate => ori rt, $0, immediate 


inst rom.om: file format elf32-tradbiqmips 
Disassembly of section .text: 
OOODOODO <_start>: 


SA El 
4: 34020020 li vO0,0xz0 


8: 3403£f£00 li v1,0xff00 
ec: 3404ffff li a0,0Oxffftf 
Disassembly of section .regintfo: 


00000000 < ram end-Ox10>: 
O: O000001e Oxie 


00000010 < ram end>: 


图 4-31 ”inst_rom.asm 文 件 的 内 容 


另外 ， 此 处 的 寄存 器 没有 使 用 $1、$2、$3、$4 这 种 方式 ， 而 是 使 用 了 
约定 命名 。MIPS32 中 通用 寄存 器 的 约定 命名 可 以 参考 第 1 章 的 表 1-1。 有 了 
inst_rom.asm 文 件 ， 在 进行 仿真 波形 分 析 的 时 候 ， 有 助 于 将 仿真 波形 中 的 
32bit 二 进 制 指令 字 与 汇编 程序 中 的 指令 对 应 ， 便 于 分 析 。 


可 以 修改 Makefile 文 件 ， 使 得 在 编译 得 到 inst_rom.data 的 同时 得 到 反 汇 
编 文 件 inst_rom.asm， 有 具体 修改 方法 不 再 详 述 ， 读 者 可 以 参考 本 书 附带 光 
盘 的 Code\Chapter4\TestAsm 目 录 下 的 Makefile 文 件 。 


4.5 “第 一 条 指令 实现 小 结 
本 章 是 很 重要 的 一 章 ， 而 且 内 容 相 对 比较 杂 ， 在 此 做 一 小 结 ， 主 要 做 


了 四 项 工作 。 


(1) 本 章 通 过 实现 指令 ori:， 搭 建 了 一 个 原始 的 五 级 流水 线 结构 ， 这 
也 是 OpenMIPS 的 核心 ， 当 然 ， 目 前 OpenMIPS 还 只 能 执行 or 指令 ， 后 续 会 


(2) 实现 了 一 个 用 于 测试 的 最 小 SOPC (X1X E HE 2h 18 25 
OpenMIPS、 指 令 存 储 器 ROM， 并 编号 了 Test Bench 测 试 文件 。 


(3) 在 ModelSim 中 通过 仿真 验证 了 ori 指 令 实 现 的 正确 性 ， 也 验证 了 
OpenMIPS 五 级 流水 线 实 现 的 正确 性 。 


(4) 详细 介绍 了 从 汇编 代码 编写 的 测试 程序 得 到 仿真 中 使 用 的 指令 
存储 器 初始 化 文件 的 过 程 ， 同 时 ， 利 用 Makefile 简 化 了 这 个 过 程 。 


pom ”逻辑 、 移 位 操作 与 空 指令 
的 实现 


第 4 章 建立 了 原始 的 OpenMIPS 五 级 流水 线 结构 ， 但 是 只 实现 了 一 
条 ori 指 令 ， 从 本 章 开始 ， 将 逐步 完善 。 本 章 首先 讨论 了 流水 线 数据 相 
天 问题 ， 然 后 修改 OpenMIPS 以 解决 该 问题 ， 并 在 5.3 节 验证 了 解决 效 
果 。 接 着 对 逻辑 、 移 位 操作 与 空 指 令 的 指令 格式 、 用 法 、 作 用 进行 了 
一 一 说 明 ， 在 5.5 节 通过 扩展 OpenMIPS 实 现 了 这 些 指令 ， 最 后 编写 测 
试 程序 ， 对 实现 效果 进行 了 检验 。 


5.1 ”流水 线 数 据 相关 问题 


我 们 在 第 4 章 实现 的 五 级 流水 线 结构 很 简单 ， 如 果 按 照 “简单 即 美 ” 
(Simple is Beautiful) 的 标准 ， 那 么 我 们 的 流水 线 是 美的 ， 但 是 不 完 
美 ， 因 为 现实 往往 是 复杂 的 ， 一 个 简单 的 流水 线 是 解决 不 了 如 此 多 现 
实 问 题 的 ， 本 节 探 讨 的 数据 相关 问题 惑 是 其 中 一 个 问题 。 在 我 们 实现 
逻辑 、 移 位 操作 等 其 他 指令 之 前 ， 必 须 先 讨论 这 个 问题 ， 因 为 这 个 问 
题 已 经 影响 测试 程序 的 编写 了 。 


流水 线 中 经 常 有 一 些 被 称 为 “相关 ”的 情况 发 生 ， 它 使 得 指令 序列 
中 下 一 条 指令 无 法 按照 设计 的 时 钟 周 期 执行 ， 这 些 “ 相 关 ” 会 降低 流水 
线 的 性 能 。 流 水 线 中 的 相关 分 为 以 下 三 种 类 型 。 


(1) 结构 相关 : 指 的 是 在 指令 执行 的 过 程 中 ， 由 于 硬件 资源 满足 
不 了 指令 执行 的 要 求 ， 发 生硬 件 资 源 冲突 而 产生 的 相关 。 比 如 : 指令 
和 数据 都 共享 一 个 存储 器 ， 在 某 个 时 钟 周期 ， 流 水 线 既 要 完成 某 条 指 


令 对 存储 器 中 数据 的 访问 操作 ， 又 要 完成 后 续 的 取 指 令 操作 ， 这 样 就 
会 发 生存 储 器 访问 冲突 ， 产 生 结 构 相 关 。 


(2) 数据 相关 : 指 的 是 在 流水 线 中 执行 的 几 条 指令 中 ， 一 条 指令 
依赖 于 前 面 指令 的 执行 结果 。 


(3) 控制 相关 : 指 的 是 流水 线 中 的 分 支 指令 或 者 其 他 需要 改写 
PC 的 指令 造成 的 相关 。 


结构 相关 、 控 制 相 关 将 在 后 续 指令 分 析 中 讨论 ， 本 市 重点 讨论 数 
据 相 关 的 问题 。 流 水 线 数据 相关 又 分 为 三 种 情况 : RAW, WAR, 
WAWo 


e RAW, EllRead After Write， 假 设 指 令 j 是 在 指令 ji 后 面 执行 的 
指令 ，RAW 表 示 指 令 i 将 数据 写 入 寄存 器 后 ， 指 令 j 才 能 从 这 
个 寄存 器 读 取 数 据 。 如 果 指 令 j 在 指令 i 写 入 寄存 器 前 党 试 读 
出 该 寄存 器 的 内 容 ， 将 得 到 不 正确 的 数据 。 

。WAR， 即 Write After Read， 假 设 指令 j 是 在 指令 i 后 面 执行 的 
指令 ，WAR 表 示 指 令 i 读 出 数据 后 ， 指 令 j 才 能 写 这 个 寄存 
器 。 如 果 指 令 j 在 指令 i 读 出 数据 前 就 写 该 寄存 器 ， 将 使 得 指 
令 i 读 出 的 数据 不 正确 。 

e WAW, EllWrite After Write， 假 设 指令 j 是 在 指令 ij 后 面 执行 的 
指令 ，WAW 表 示 指 令 i 将 数据 写 入 寄存 器 后 ， 指 令 j 才 能 将 数 
据 写 入 这 个 寄存 器 。 如 果 指 令 j 在 指令 i 之 前 写 该 寄存 器 ， 将 
使 得 该 寄存 器 的 值 不 是 最 新 值 。 


对 于 第 4 章 建立 的 原始 OpenMIPS 五 级 流水 线 而 言 ， 从 ori 指 令 的 实 
现 过 程 可 以 知道 ， 只 有 在 流水 线 回 写 阶 段 才 会 写 寄 存 器 (实际 上 ， 其 


余 指 令 也 是 一 样 的 ， 在 后 面 实现 其 余 指 令 时 ， 对 这 一 点 会 更 加 清 
楚 ) ， 因 此 不 存在 WAW 相 关 。 又 因为 只 能 在 流水 线 译 码 阶段 读 寡 存 
器 、 回 写 阶段 写 寄存 器 ， 不 存在 WAR 相 关 ， 所 以 OpenMIPS 的 流水 线 
只 存在 RAW 相 关 。RAW 相 关 有 三 种 情况 。 


O 相 邻 措 令 间 存 在 数据 相关 


考虑 如 下 代码 。 
1 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
2 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 0x1120 


第 1 条 ori 指 令 将 写 寄 存 器 $1， 随 后 的 第 2 条 ori 指 令 需 要 读 出 $1 的 数 
据 ， 但 是 第 1 条 ori 指 令 在 回 写 阶段 才 会 将 其 运算 结果 写 入 $1， 而 第 2 条 
ori 指 令 在 译 码 阶段 就 需要 读 取 $1 的 值 ， 此 时 第 1 条 ori 指 令 还 处 于 执行 
阶段 ， 所 以 得 到 的 必然 不 是 第 1 条 ori 指 令 计 算得 出 的 结果 ， 按 这 个 值 
运算 ， 必 然 会 出 错 。 如 图 5-1 所 示 ， 这 种 情况 可 以 称 为 相 邻 指令 间 存 在 
数据 相关 ， 针 对 OpenMIPS 的 具体 情况 ， 也 可 以 称 为 流水 线 译 码 、 执 行 
阶段 存在 数据 相关 。 


第 1 条 ori 指 令 将 在 回 写 阶段 最 后 
/| 的 时 钟 上 升 沿 把 运算 结果 写 入 $1 
A \ \ / \ / \ N fi \ / \ / \ 
mep / \ / \ / / \ Y / \ \ / 
/ 
1 ori $1,80,0x1100 < Hele >< FRAG > 执行 > 访 存 >< 回 写 > 
2 ori $2,$1,0x0020 ls AS 执行 >C 访 存 X 回 写 、 、 


L 
"i 


第 2 条 ori 指 令 将 在 译 码 阶段 取得 $1 | 一 
的 值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-1 相 邻 指令 间 存 在 数据 相关 


O 相隔 1 条 指令 的 指令 间 存 在 数据 相关 


考虑 如 下 代码 。 


工 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
2 ori $3,$0,0xffff # $3 = $0 | Oxffff = Oxffff 
3 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 0x1120 


第 1 条 ori 指 令 将 写 寄 存 器 $41， 第 3 条 ori 指 令 在 译 码 阶段 需要 读 取 寄 
存 器 $1， 此 时 第 1 条 ori 指 令 还 处 于 访 存 阶段 ， 所 以 得 到 的 必然 也 不 是 
正确 的 值 。 如 图 5-2 所 示 ， 这 种 情况 可 以 称 为 相隔 1 条 指令 的 指令 间 存 
在 数据 相关 ， 针 对 OpenMIPS 的 具体 情况 ， 也 可 以 称 为 流水 线 译 码 、 访 
存 阶 段 存在 数据 相关 。 
| 第 1 条 ori 指 令 将 在 回 写 阶段 最 后 


/的 时 钟 上 升 沿 把 运算 结果 写 入 $1 


/ 


a NN / 
1 ori $1,80,0x1100 < 取 指 >< vers x 执行 >C 访 存 E 
2 ori $3,$0,0xffff CH PERS 执行 >《 访 存 >< 回 写 > 


3 ori $2,$1,0x0020 <a> > 执行 >C 访 存 E > 


第 3 条 ori 指 令 将 在 译 码 阶段 取得 $1 的 | 一 
值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-2 ”相隔 1 条 指令 的 指令 间 存 在 数据 相关 


@ 相隔 2 条 指令 的 指令 间 存 在 数据 相关 


考虑 如 下 代码 。 
1 ori $1,$0,0x1100 # $1 = $0 | 0x1100 = 0x1100 
2 ori $3, $0, Oxffff # $3 = $0 | Oxffff = Oxffff 
3 ori $4, $0, Oxf fff # $4 = $0 | Oxffff = Oxffff 
4 ori $2,$1,0x0020 # $2 = $1 | 0x0020 = 0x1120 


第 1 条 ori 指 令 将 写 寄 存 器 $1， 第 4 条 ori 指 令 在 译 码 阶段 需要 读 取 寄 
存 器 $1， 此 时 第 1 条 指令 处 于 回 写 阶段 ， 在 回 写 阶段 最 后 的 时 钟 上 升 沿 
才 会 将 运算 结果 写 入 $1， 所 以 第 4 条 ori 指 令 得 到 的 不 是 正确 的 寄存 器 
$1 的 值 。 如 图 5-3 所 示 ， 这 种 情况 可 以 称 为 相隔 2 条 指令 的 指令 间 人 存在 
效 据 相 天 ， 针 对 OpenMIPS 的 具体 情况 ， 也 可 以 称 为 流水 线 译 码 、 回 与 
阶段 存在 数据 相关 。 


第 1 条 ori 指 令 将 在 回 写 阶段 最 后 
/ 的 时 钟 上 升 沿 将 运算 结果 写 入 $1 
/ 


A / ry YF 


1 ori $1,80,0x1100 < 取 指 >< BE > 执行 > 访 存 > 回 写 > 


2 ori $3,$0,0xffff WE CR IME HE THIS 
ori $4,$0,0xffff We > 译 码 > 执行 x 访 存 >< 回 写 > 


4 ori $2,$1,0x0020 or X x 执行 >C 访 存 x 回 写 > 


第 4 条 ori 指 令 将 在 译 码 阶段 取得 $1 的 | 一 一 
值 ， 此 时 得 到 的 不 是 正确 的 值 


图 5-3 ”相隔 2 条 指令 的 指令 间 存 在 数据 相关 


其 中 ， 相 隔 2 条 指令 存在 数据 相关 ( 即 流水 线 译 码 、 回 写 阶段 存在 
数据 相关 ) 这 种 情况 ， 在 第 4 章 设计 的 Regfile 模 块 中 已 经 得 到 了 解决 ， 
Regfile 模 块 部 分 代码 如 下 。 


module regfile( 


); 


YA GP GE GP GE GP GE GP OE GP GE GP GE GP GE GP GE GP Gd GP GE GP Gd GP GE GP Gd GP GE GP GE GP GE GP GE GP GE EP EP IS BP EP BPE? BP EAS BPE? BP 2 EA? 


在 读 操作 中 有 一 个 判断 ， 如 果 要 读 取 的 寄存 器 是 在 下 一 个 时 钟 上 
升 治 要 写 入 的 寄存 器 ， 那 么 就 将 要 写 入 的 数据 直接 作为 结果 输出 。 如 
此 就 解决 了 相隔 2 条 指令 存在 数据 相关 的 情况 。 


对 于 相 邻 指令 间 存 在 数据 相关 、 相 隔 1 条 指令 的 指令 间 存 在 数据 相 
天 这 两 种 情况 ， 有 三 种 解决 方法 。 


O 插入 暂停 周期 : 当 检测 到 相关 时 ， 在 流水 线 中 插入 一 些 暂停 周 
期 ， 如 图 5-4 所 示 。 


a PASEAR NA A AA 
1 ori $1,$0,0x1100 < 取 指 > BE > 执行 > 访 存 > 回 写 


2 ori $2,$1,0x0020 ai I TBS > 


插入 暂停 周期 | 


图 5-4 ”在 流水 线 中 插入 暂停 周期 消除 数据 相关 


编译 器 调度 : 编译 器 检测 到 相关 后 ， 可 以 改变 部 分 指令 的 执行 
顺序 ， 如 图 5-5 所 示 。 


ori $1, $0, 0x1100 ori $1, $0, 0x1100 
ori $2, $1, 0x0020 ~ ori $4, $3, Oxffff 
ori $4, $3, Oxffff > [ori $6, $5, 0x00ff 
ori $6, $5, Ox00ff ori $2, $1, 0x0020 

存在 数据 相关 消除 数据 相关 
图 5-5 ”编译 器 通过 改变 指令 执行 顺序 消除 相关 


@ 数据 前 推 : 将 计算 结果 从 其 产生 处 直接 送 到 其 他 指令 需要 处 或 
所 有 需要 的 功能 单元 处 ， 避 免 流水 线 暂停 。 如 图 5-6 所 示 的 例子 中 ， 新 
的 $1 值 实际 上 在 第 1 条 ori 指 令 的 执行 阶段 已 经 计算 出 来 了 ， 可 以 直接 
将 该 值 从 第 1 条 ori 指 令 的 执行 阶段 送 入 第 2 条 ori 指 令 的 译 码 阶段 ， 从 而 
使 第 2 条 ori 指 令 在 译 码 阶段 得 到 $1 的 新 值 。 也 可 以 直接 将 该 值 从 第 1 条 
ori 措 令 的 访 存 阶段 送 入 第 3 条 ori 指 令 的 译 码 阶 段 ， 从 而 使 第 3 条 ori 指 令 
在 译 码 阶 段 也 得 到 $1 的 新 值 。 


时 钟 ZN Lf 


1 ori $1,80,0x1100 < 取 指 >< 译 码 > 执行 >< 访 存 x > 


2 ori $2,$1,0x0020 <a >< >> >< 回 写 > 


3 ori $3,$1,0x4400 <a >< 译 码 > 执行 > AE > 


图 5-6 ”数据 前 推 解决 流水 线 相关 


读者 需要 注意 ， 第 (3) 种 方法 有 一 个 前 提 就 是 新 的 寄存 器 的 值 可 以 
在 执行 阶段 计算 出 来 ， 如 果 是 加 载 指令 ， 那 么 就 不 满足 这 个 前 提 ， 


为 加 载 指 令 在 访 存 阶段 才能 获得 最 终结 果 ， 这 是 一 种 load 相 关 ， 本 书 
将 在 实现 加 载 存储 指令 的 时 候 考 虑 这 种 情况 ， 本 章 暂 不 考虑 。 


5.2 ”OpenMIPS 对 数据 相关 问题 的 
解决 措施 


OpenMIPS 处 理 器 采用 数据 前 推 的 方法 来 解决 流水 线 数据 相关 问 
题 。 通 过 补充 完善 图 4-4 原 始 的 数据 流 图 ， 添 加 部 分 信号 使 得 可 以 完成 
数据 前 推 的 工作 ， 如 图 5-7 所 示 。 主 要 是 将 执行 阶段 的 结果 、 访 存 阶段 
的 结果 前 推 到 译 码 阶段 ， 参 与 译 码 阶段 选择 运算 源 操作 数 的 过 程 。 


a = 
rte > M 
Su > 上 >= 
s ae PX ] 
„el e AO u J 
€ 存储 器 I, 器 | > ALU j? 
pP] ar | 
> > > 
fam | | 
ArH 一 | 
END AAA 全 
clk | | 
Bi de 译 码 J Mr vit, AIS, 


图 5-7 添加 了 数据 前 推 的 OpenMIPS 数 据 流 图 


图 5-8 给 出 了 为 实现 数据 前 推 而 对 OpenMIPS 系 统 结构 所 做 的 修 
改 ， 有 具体 有 两 个 方面 。 


译 码 O 执行 | vit MEE 
ID EX/MEM MEM MEM/WB 
> ex_wdata mem_wdata >| wdata_o >) wb_wdata 
r> ex_wd mem_wd Ha wd_o >| b_wd 
> mem wdata i E r | | ex_wreg mem_wreg Ha wreg_0 > wb_wreg 
m mem wd i | | rst 
m~~ mem_wreg_i | f clk mem.v 
i | ex_mem.v mem_wb.v 
| OpenMIPS 结 构图 
| “为 解决 数据 相关 而 做 的 修改 ) 


图 5-8 ”为 实现 数据 前 推 而 对 OpenMIPS 结 构 所 做 的 修改 


(1) 将 处 于 流水 线 执行 阶段 的 指令 的 运算 结果 ， 包 括 : 是 否 要 写 
目的 寄存 器 wreg_o、 要 写 的 目的 寄存 器 地 址 wd_o、 要 写 入 目的 寄存 器 
的 数据 wdata_o 等 信息 送 到 译 码 阶段 ， 如 图 5-8 中 虚线 所 示 。 


(2) 将 处 于 流水 线 访 存 阶段 的 指令 的 运算 结果 ， 包 括 : 是 否 要 写 
目的 寄存 器 wreg_o、 要 与 的 目的 寄存 器 地 址 wd_o、 要 写 入 目的 寄存 器 
的 数据 wdata_o 等 信息 送 到 译 码 阶 段 。 


为 此 ， 译 码 阶 段 的 ID 模块 要 增加 如 表 5-1 所 示 的 接口 。 


表 5-1 ID 模块 要 增加 的 接口 


T Eur: 


令 要 写 的 目的 寄存 器 地 址 
则 的 指令 要 写 入 目的 寄存 器 的 数据 


译 码 阶段 的 ID 模块 会 依据 送 入 的 信息 ， 进 行 综合 判断 ， 解 决 数据 
相关 ， 给 出 最 后 要 参与 运算 的 操作 数 。ID 模 块 的 代码 要 做 如 下 修改 ， 


其 中 主要 的 修改 部 分 使 用 加 粗 、 和 斜体 表示 。 修 改 后 的 代码 位 于 本 书 光 
盘 中 Code\Chapter5_1 目 录 下 的 id.v 文 件 。 


endmodule 


除了 修改 译 码 阶段 ID 模块 的 代码 ， 还 要 修改 顶层 模块 OpenMIPS 
对 应 的 代码 ， 在 其 中 增加 图 5-8 所 示 的 连接 关系 。 具 体 修改 过 程 不 在 书 
中 列 出 ， 读 者 可 以 参考 本 书 附 带 光 盘 中 Code\Chapter5 1 目录 下 的 


openmips.v 文 件 。 


5.3 ”测试 数 据 相 关 问 题 的 解决 效果 


测试 程序 如 下 ， 其 中 存在 5.1 节 讨论 的 RAW 相 关 的 三 种 情况 ， 产 文 
件 是 本 书 附带 光盘 中 Code\Chapter5_1\AsmTest 目 录 下 的 inst_rom.S 文 


件 。 


.Org 0x0 

.global _start 

,Set noat 

Estati 
ori $1, $0, 0x1100 
ori $1, $1,0x0020 
ori $1, $1,0x4400 
ori $1, $1,0x0044 


间 令 的 注释 给 出 了 预期 执行 效果 。 将 上 述 inst_rom.S 文 件 与 第 4 章 
实现 的 Bin2Mem.exe、Makefile、ram.ld 这 三 个 文件 复制 到 Ubuntu 虚 拟 
机 中 的 同一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 
make all， 即 可 得 到 能 够 用 于 ModelSim 仿 真 的 inst_rom.data 文 件 。 


# $1 
# $1 
# $1 
# $1 


$0 
$1 
$1 
$1 


0x1100 
0x0020 
0x4400 
0x0044 


0x1100 
0x1120 
0x5520 
0x5564 


在 ModelSim 中 新 建 一 个 工程 ， 添 加 本 书 附 带 光 盘 中 
Code\Chapter5_1 目 录 下 的 所 有 .v 文 件 ， 然 后 可 以 编译 。 再 将 上 面 得 到 
的 inst_rom.data 文 件 复制 到 ModelSim 工 程 的 目录 下 ， 就 可 以 进行 仿真 
了 。ModelSim 中 新 建 工 程 、 仿 真 的 详细 步骤 可 以 参考 第 2 章 。 


运行 仿真 ， 观 察 寄存 器 $1 值 的 变化 ， 如 图 5-9 所 示 ，$1 的 变化 符合 
预期 ， 所 以 修改 后 的 OpenMIPS 正 确 解决 了 数据 相关 问题 。 


j (1) 取 到 的 指令 
J 


| yf l | l | l | l | l | l | l | l F 
{34011100 {34210020 134214400 134210044} 


sto 
Sti 


de rst 
E dk 
EÊ if_inst 
@® regfilel/regs[1] 


KX. 
00... {00001100 }00001120 }00005520 }00005564 


(2) $1 的 值 从 0x00001100 最 终 变 为 0x00005564， 符 合 预期 | 


图 5-9 ”ModelSim 仿 真 结果 ， 显 示 $1 的 变化 符合 预期 


5.4 逻辑 、 移 位 操作 与 空 指令 说 明 


MIPS32 指 令 集 架构 中 定义 的 逻辑 操作 指令 有 8 条 : and, andi, 
or、ori、xXor、Xori、nor、]lui， 其 中 ori 措 令 已 经 实现 了 本 章 要 实现 的 其 


余 7 条 指令 。 


MIPS32 指 令 集 架构 中 定义 的 移 位 操作 指令 有 6 条 : sll、sllv、sra、 


srav, srl, srlvo 


MIPS32 指 令 集 架构 中 定义 的 空 指 令 有 2 条 : nop, ssnopo EH 
ssnop 是 一 种 特殊 类 型 的 空 操作 ， 在 每 个 周期 发 射 多 条 指令 的 CPU 中 ， 
使 用 ssnop 指 令 可 以 确保 单独 占用 一 个 发 射 周期 。OpenMIPS 设 计 为 标 
量 处 理 器 ， 也 就 是 每 个 周期 发 射 一 条 指令 ， 所 以 ssnop 的 作用 与 nop 相 
同 ， 可 以 按照 nop 指 令 的 处 理 方式 来 处 理 ssnop 指 令 。 


另外 ，MIPS32 指 令 集 架 构 中 还 定义 了 sync、pref 这 2 条 指令 ， 其 中 
sync 指 令 用 于 保证 加 载 、 存 储 操作 的 顺序 ， 对 于 OpenMIPS 而 言 ， 是 严 
格 按照 指令 顺序 执行 的 ， 加 载 、 存 储 操作 也 是 按照 顺序 进行 的 ， 所 以 
可 以 将 sync 指 令 当 作 nop 指 令 处 理 ， 在 这 里 将 其 归纳 为 空 指令 。Ppref 指 
令 用 于 缓存 预 取 ，OpenMIPS 没 有 实现 缓存 ， 所 以 也 可 以 将 pref 指 令 当 
作 nop 指 令 处 理 ， 此 处 也 将 其 归纳 为 空 指令 。 


以 上 17 条 指令 按照 格式 、 作 用 的 不 同 ， 又 可 分 为 几 类 ， 分 别 说 明 
如 下 。 


1. and、 or、 xor、 nor 


这 4 条 指令 的 格式 如 图 5-10 所 示 ， 从 图 中 可 以 发 现 ， 这 4 条 指令 都 
是 R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000， 也 就 是 MIPS32 指 令 集 架构 
中 定义 的 SPECIAL 类 。 此 外 ， 第 6 一 10bit 都 为 0， 需 要 依据 指令 中 第 0 
一 5bit 功 能 码 的 值 进一步 判断 是 哪 一 种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 


ene de rt rd 00000 bo a and 指 令 
SPECL < L | rt rd 00000 aA or 指令 
aia rt rd 00000 Rory | xor 指 信 
“oto | = rt rd 00000 NOR | norte 


图 5-10 and、or、xor、nor 指 令 格 式 
。 当 功 能 码 是 6b100100 时 ， 表 示 是 and 指 令 ， 人 逻辑 “与 ”运算 。 


指令 用 法 为 : and rd, rs, rto 


指令 作用 为 : rd <- rs AND rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 
址 为 rt 的 通用 寄存 器 的 值 进行 逻辑 “与 运算 ， 运 算 结 果 保 存 到 地 址 为 rd 
的 通用 寄存 器 中 。 


。 当 功 能 码 是 6b100101 时 ， 表 示 是 or 指令 ， 逻 辑 “ 或 ”运算 。 
指令 用 法 为 : or rd, rs, rto 


指令 作用 为 : rd <- rs OR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 
为 rt 的 通用 寄存 器 的 值 进行 逻辑 “或 运算， 运算 结果 保存 到 地 址 为 rd 的 
通用 寄存 器 中 。 


。 当 功 能 码 是 6b100110 时 ， 表 示 是 xor 指 令 ， 异 或 运算 。 
指令 用 法 为 : xor rd, rs, rto 


指令 作用 为 : rd <- rs XOR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 
址 为 rt 的 通用 寄存 器 的 值 进行 逻辑 “ 异 或 “运算 ， 运 算 结 果 保 存 到 地 址 为 
rd 的 通用 寄存 器 中 。 


。 当 功 能 码 是 6b100111 时 ， 表 示 是 nor 指 令 ， 或 非 运算 。 
指令 用 法 为 : nor rd, rs, rto 


指令 作用 为 : rd <- rs NOR rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 ， 与 
地 址 为 rt 的 通用 寄存 器 的 值 进行 逻辑 < 或 非 ” 运 算 ， 运 算 结 果 保 存 到 地 址 
为 rd 的 通用 寄存 器 中 。 


2。andi、xori 指 令 


这 2 条 指令 的 格式 如 图 5-11 所 示 ， 从 图 5-11 中 可 以 发 现 这 2 条 指令 
都 是 I 类 型 指令 ， 可 以 依据 指令 中 第 26~31bit 指 令 码 的 值 判断 是 哪 一 种 
指令 。 


31 26 25 21 20 16 15 0 


ANDI | coe 
001100 rs rt immediate andif§4 
XORI RER ae 
001110 rs rt immediate xori 指 令 


图 5-11 andi、xori 指 令 格式 
. 当 指 令 人 码 是 6b001100， 表 示 是 andi 指 令 ， 逻 辑 * 与 ?运算 。 
指令 用 法 为 : andi rt, rs, immediate, 


指令 作用 为 : rt <- rs AND zero_extended(immediate)， 将 地 址 为 rs 
的 通用 寄存 器 的 值 与 指令 中 立即 数 进行 零 扩 展 后 的 值 进行 逻辑 “与 * 运 
算 ， 运 算 结果 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 


。 当 指 令 码 是 6b001110， 表 示 是 xori 指 令 ， 异 或 运算 。 
指令 用 法 为 : xori rt, rs, immediateo 


指令 作用 为 : rt <- rs XOR zero O ; ida 
NERSFENESBESHLUNNETEN RAM AA TA 
运算 ， 运 算 结果 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 


。lui 指 令 


lui 指 令 的 格式 如 图 5-12 所 示 ， 从 图 中 可 以 发 现 lui 指 令 是 I 类 型 指 
令 ， 可 以 依据 指令 中 第 26 人 31bit 指 令 码 的 值 是 否 为 6b001111， 从 而 判 
断 是 否 是 lui 指 令 。 


31 26 25 21 20 16 15 0 


LUI 


001111 00000 rt immediate 


图 5-12 lui 指 令 格 式 
指令 用 法 为 : lui rt, immediate, 


指令 作用 为 : rt <- immediate || 016 ， 将 指令 中 的 16bit 立 即 数 保存 
到 地 址 为 rt 的 通用 寄存 器 的 高 1 人 位。 另外， 地址 为 rt 的 通用 寄存 器 的 低 
16 位 使 用 0 填充 。 


4。sll、sllv、sra、srav、srl、srlv 指 令 


这 6 条 指令 的 格式 如 图 5-13 所 示 ， 从 图 5-13 中 可 以 发 现 这 6 条 指令 
都 是 R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000。 也 融 是 说 ， 都 是 
SPECIAL 类 ， 需 要 依据 指令 中 第 0 一 5bit 功 能 码 的 值 进一步 判断 是 哪 一 


种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 


000000 | 00000 rt rd sa Ea sl 指令 
noch 00909 rt rd sa 0 a ð stl 指令 
coco en > e = 00001 1 sra 指 令 
000000 | = rt rd 00000 000100 | sllv 指 令 
or ES rt rd 00000 a ae srlv 指 令 
oo: me rt rd 00000 E a 3 srav 指 令 


图 5-13 sll、srl、sra、sllv、srlv、srav 指 令 格 式 
e 当 功 能 码 是 6b000000， 表 示 是 sl 指令， 逻辑 左 移 。 
指令 用 法 为 : sll rd, rt, sao 


站 令 作用 为 : rd <- rt << sa (logic)， 将 地 址 为 rt 的 通用 寄存 器 的 值 
向 左 移 sa 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 


。 当 功 能 码 是 6b000010， 表 示 是 sl 指令 ， 逻 辑 右 移 。 
指令 用 法 为 : srl rd, rt, sao 


站 令 作用 为 : rd <- rt >> sa (logic)， 将 地 址 为 rt 的 通用 寄存 器 的 值 
向 右 移 sa 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 


。 当 功 能 码 是 6b000011， 表 示 是 sra 指 令 ， 算 术 右 移 。 


指令 用 法 为 : sra rd, rt sao 


指令 作用 为 : rd <- rt >> sa (arithmetia 〇 j， 将 地 址 为 rt 的 通用 寄存 器 
的 值 向 右 移 sa 位 ， 空 出 来 的 位 置 使 用 rt[31] 的 值 填充 ， 结 果 保 存 到 地 址 
为 rd 的 通用 寄存 器 中 。 


。 当 功 能 码 是 6b000100， 表 示 是 sllv 指 令 ， 逻 辑 左 移 。 
指令 用 法 为 : sllv rd, rt, rso 


指令 作用 为 : rd <-rt<<rs[4:0](ogic)， 将 地 址 为 rt 的 通用 寄存 器 的 
值 向 左 移 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 全 4bit 确 定 。 


。 当 功 能 码 是 6b000110， 表 示 是 srlv 指 令 ， 逻 辑 右 移 。 
指令 用 法 为 : srlv rd, rt, rso 


指令 作用 为 : rd <- rt >> rs[4:0](dogic)， 将 地 址 为 rt 的 通用 寄存 器 的 
值 向 右 移 位 ， 空 出 来 的 位 置 使 用 0 填充 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄 
存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 全 4bit 确 定 。 


。 当 功 能 码 是 6b000111， 表 示 是 srav 指 令 ， 算 术 右 移 。 
指令 用 法 为 : srav rd, rt, rso 


指令 作用 为 : rd <- rt >> rs[4:0](arithmetic)， 将 地 址 为 rt 的 通用 寄存 
器 的 值 向 右 移 位 ， 空 出 来 的 位 置 使 用 rt[31] 填 充 ， 结 果 保 存 到 地 址 为 rd 
的 通用 寄存 器 中 。 移 位 位 数 由 地 址 为 rs 的 寄存 器 值 的 第 0 全 4bit 确 定 。 


总 结 来 说 ， 这 6 条 移 位 操作 指令 可 以 分 为 两 种 情况 : sllv、srav、 
srlv 这 3 条 指令 的 助 记 符 最 后 有 “v”， 表 示 移 位 位 数 是 通过 寄存 器 的 值 确 


定 的 ，sll、sra、sH 这 3 条 指令 的 助 记 符 最 后 没有 “v”， 表 示 移 位 位 数 就 
是 指令 中 第 6 一 10bit 的 sa 值 。 


5。nop、ssnop、sync、pref 指 令 


这 4 条 指令 的 格式 如 图 5-14 所 示 。 从 图 5-14 中 可 以 发 现 nop、 
ssnop、sync 这 3 条 指令 都 是 R 类 型 指令 ， 并 且 指 令 码 都 是 6b000000， 也 
就 是 说 ， 都 是 SPECIAL 类 


31 26 25 21 20 16 15 11 10 6 5 0 


000000 | 00000 | 00000 | 00000 | 00000 ayaa | nop 指 令 
oc | 00000 | 00000 | 00000 | 00001 000000 | sanop 指 令 
a 00000 | 00000 | 00000 | 00001 beens sync 指 令 
ie il base hint offset pref 指 念 


图 5-14 nop、ssnop、sync、pref 指 令 的 格式 


更 进一步 可 以 发 现 ，nop、 ssnop 两 条 指令 的 功能 码 都 是 
6'b000000, 与 之 前 介绍 的 逻辑 左 移 指 令 sll 的 功能 码 相 同 ， 这 样 在 译 码 
的 时 候 会 不 会 有 冲突 : nop 指 令 的 二 进 制 码 与 sll $0,$0,0 的 二 进 制 码 一 
样 ， 处 理 器 如 何 译 码 ? ssnop 指 令 的 二 进 制 码 与 sl $0,$0,1 的 二 进 制 码 一 
样 ， 处 理 器 如 何 译 码 ? 


nop = sll $0,$0,0 
ssnop = sll $0,$0,1 


其 实 两 者 是 等 价 的 ，sl 指 令 向 $0 寄 存 器 保存 移 位 结果 ， 实 际 不 会 
有 任何 效果 ， 因 为 无 论 向 $0 写 任何 数 ， 其 值 始终 为 0， 所 以 效果 等 同 于 


什么 都 不 做 ， 这 也 正 是 空 指 令 nop、ssnop 的 效果 。 所 以 nop、ssnop 指 
令 不 用 特意 实现 ， 完 全 可 以 当 作 特殊 的 逻辑 左 移 指令 sll。 


5.5 ”修改 OpenMIPS 以 实现 逻辑 、 
移 位 操作 与 空 指令 
为 了 实现 逻辑 、 移 位 操作 与 空 指令 (其 中 nop、ssnop 不 用 特意 实 


现 ， 可 以 认为 是 特殊 的 逻辑 左 移 指令 sll) ， 只 需要 修改 OpenMIPS 的 如 
下 两 个 模块 。 


。 修改 译 码 阶段 的 ID 模块 ， 用 以 实现 对 上 述 指令 的 译 码 。 
。 修改 执行 阶段 的 EX 模块 ， 使 其 按照 译 码 结果 进行 运算 。 


5.5.1 ”修改 译 码 阶段 的 ID 模 块 


首先 给 出 如 下 安定 义 ， 都 在 文件 defines.v 中 定义 ， 读 者 可 以 在 本 
书 附带 光盘 中 Code\Chapter5_2 目 录 下 找到 该 文件 。 


“define EXE AND 6'b100100 //and 指 令 的 功能 码 
“define EXE OR 6'b100101 //or 指 令 的 功能 码 

‘define EXE XOR 6'b100110 //Xor 指 令 的 功能 码 
“define EXE NOR 6'b100111 //nor 指 令 的 功能 码 
“define EXE ANDI 6'b001100 //andi 指 令 的 指令 码 
“define EXE_ORI 6'b001101 //ori 指 令 的 指令 码 
“define EXE XORI 6'b001110 //Xxori 指 令 的 指令 码 


“define EXE LUI 6'b001111 //1lui 指 令 的 指令 码 


“define EXE SLL 6'b000000 //Ss1L1 指 令 的 功能 码 


“define EXE_SLLV 6'b000100 //sllv 指 令 的 功能 码 
“define EXE SRL 6'b000010 //sra 指 令 的 功能 码 
“define EXE SRLV 6'b000110 //srlv 指 令 的 功能 码 
“define EXE_SRA 6'b000011 //sra 指 令 的 功能 码 
“define EXE_SRAV 6'b000111 //srav 指 令 的 功能 码 
“define EXE SYNC 6'b001111 //sync 指 令 的 功能 码 
“define EXE PREF 6'b110011 //pref 指 令 的 指令 码 
“define EXE_SPECIAL_INST 6'b000000 //SPECIAL 类 指令 的 指令 码 


对 指令 进行 译 码 的 前 提 是 能 判断 出 指令 种 类 ， 这 个 过 程 如 图 5-15 
所 示 。 其 中 op 就 是 指令 的 第 26~31bit， 即 指令 码 ，op2 就 是 指令 的 第 6 
~10 bit，op3 就 是 指令 的 第 0~5bit， 即 功能 码 ，op4 就 是 指令 的 第 16~ 
20bit， 定 义 如 下 。 


wire[5:0] op = inst_i[31:26]; // 指令 码 
wire[4:0] op2 = inst_i[10:6]; 
wire[5:0] op3 = inst_i[5:0]; // 功能 码 
wire[4:0] op4 = inst_i[20:16]; 


= EXE_SPFCTAL_TNST -0 = EXE_OR 
> 


op op2 > op3 > orf i 
= EXE_AND = 
一 一 一 一 > and 指 令 
= EXE_ORI -一 4 =EXE_XOR - 
ori 指 令 = 其 它 一 一 一 一 >| xor 指 令 
=EXE_ANDI — =EXE_NOR = 
> andi 指 令 > nor 指 令 
— EXE XORI - EXE SLLV = 
xori 指 令 无 效 指令 Y YB sllv 指 令 
= EXE_LUI =EXE_SRLV = 
lui 指 令 c srlv 指 令 
= EXE_PREF =EXE_SRAV 
pref 指 令 一 一 一 一 >| srav 指 今 
= 其 它 rn = EXE_SYNC z 
'——— 36% = sync 指 令 
= 其 它 ST 
无 效 指令 
一 一 =0 =EXE_STT 
inst_i[31:21] > op3 > sll 指 令 wire[5:0] op = inst_i[31:26]; 
= EXE_SRL BA wire[4:0] op2 = inst _i[ 10:6]; 
m SI 指令 = ie Be = 
=EXE_SRA wire[5:0] op3 = inst_i[5:0]; 
sraf G4 wire[4:0] op4 = inst_i[20:16]; 


图 5-15 ”确定 指令 种 类 的 过 程 


首先 依据 指令 码 op 进 行 判 断 ， 如 果 是 SPECIAL 类 指令 ， 再 判断 指 
令 的 第 6 一 10bit (Blop2) 是 否 为 0， 如 果 为 0， 那 么 再 依据 功能 码 op3 
进行 最 终 判 断 ， 确 定 指令 am 如 果 指 令 码 op 不 为 SPECIAL， 

么 就 直接 依据 指令 码 op 的 值 进行 判断 。 


只 有 在 确定 指令 sll、srl、sra 的 时 候 有 一 点 特殊 ， 从 图 5-13 可 知 ， 

这 3 条 指令 都 是 SPECIAL 类 指令 ， 但 是 这 3 条 指令 还 要 求 第 21 人 25bit 为 

0， 而 且 第 6 一 10bit 为 移 位 位 数 ， 所 以 这 3 条 指令 的 判断 过 程 是 : 判断 

ASE 21 人 31bit 是 否 全 为 0， 如 果 全 为 0， 那 么 再 依据 功能 码 op3 进 
行 最 终 判 断 ， 确 定 指 令 类 型 。 


ID 模块 主要 修改 内 容 如 下 ， 完 整 的 代码 可 以 参考 本 书 附带 光盘 中 
Code\Chapter5_2 目 录 下 的 id.v 文 件 。 


module id( 


reg2_read_o <= 1'b1; 

imm[4:0] <= inst_i[10:6]; 
wd_o <= inst_i[15:11]; 
instvalid <= “InstValid; 


end 


end //if 
end //always 


endmodule 


对 任 一 条 指令 而 言 ， 译 码 工作 的 主要 内 容 是 : 确定 要 读 取 的 寄存 
器 情况 、 要 执行 的 运算 和 要 写 入 的 目的 寄存 器 三 方面 的 信息 。 下 面 对 
其 中 几 个 典型 指令 的 译 码 过 程 进行 解释 。 


1. and 指 令 的 译 码 过 程 


and 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 (or、xor、nor 指 令 的 译 
码 过 程 可 以 参考 and 指 令 ) o. 


(1) 要 读 取 的 寄存 器 情况 : and 指 令 需 要 读 取 rs、rt 寄 存 器 的 值 ， 
所 以 设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 Regfile 模 块 读 端口 1 
读 取 的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 and 指 
令 中 的 rs， 默 认 通 过 Regfile 模 块 读 端 口 2 读 取 的 寄存 器 地 址 reg2_addr_o 
的 值 是 指令 的 第 16~20bit， 正 是 and 指 令 中 的 rt。 


(2) 要 执行 的 运算 : and 指 令 要 进行 的 是 逻辑 “与 操作 ， 所 以 设 
置 alusel _o 为 EXE_RES_LOGIC， 设 置 aluop_o 为 EXE_AND_OP。 


(3) 要 写 入 的 目的 寄存 器 : and 指 令 需 要 将 结果 写 入 目的 寄存 
器 ， 所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 
地 址 ， 默 认 是 指令 字 的 第 11~ 人 15bit， 正 是 and 指 令 中 rd 的 位 置 。 


2。andi 指 令 的 译 码 过 程 


andi 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 (xori 指 令 的 译 码 过 程 可 
以 参考 andi 指 令 ) 。 


1) 要 读 取 的 寄存 器 情况 : andi 指 令 只 需要 读 取 rs 寡 存 器 的 值 ， 
所 以 设置 regl_read_o 为 1、reg2_read_o 为 0。 默 认 通 过 Regfile 模 块 读 端 
口 1 读 取 的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 andi 
指令 中 的 rs。 设 置 reg2_read_o 为 0， 上 暗含 使 用 立即 数 作 为 运算 的 操作 
数 。imm 就 是 措 令 中 的 立即 数 进 行 零 扩 展 后 的 值 。 


(2) 要 执行 的 运算 : andi 指 令 要 进行 的 是 逻辑 “与 操作 ， 所 以 设 
置 alusel o 为 EXE_RES_LOGIC ， 设 置 aluop o 为 EXE_AND_OP。 这 一 
点 与 and 指 令 的 译 码 过 程 一 样 。 


(3) 要 写 入 的 目的 寄存 器 : andi 指 令 需 要 将 结果 写 入 目的 寄存 
器 ， 所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 
地 址 ， 默 认 是 指令 字 的 第 11~ 人 15bit， 在 此 需要 修改 ， 对 andi 指 令 
言 ， 目 的 寄存 器 地 址 是 指令 字 的 第 16~20bit。 


3。sllv 指 令 的 译 码 过 程 


sllv 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 ， (srlv、srav 指 令 的 译 
码 过 程 可 以 参考 sllv 指 令 ) o 


(1) 要 读 取 的 寄存 器 情况 : 同 and 指 令 一 样 ， 设 置 reg1_read_o 为 
1, reg2 read_o7J1o 


(2) 要 执行 的 运算 : sllv 指 令 要 进行 的 是 逻辑 左 移 操作 ， 所 以 设 
置 alusel _o 为 EXE_RES_SHIFT， 设 置 aluop_o 为 EXE_SLL_OP。 


(3) 要 写 入 的 目的 寄存 器 : 同 and 指 令 一 样 ， 设 置 wreg_o 为 
WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 地 址 ， 默 认 是 指令 字 的 
第 11~~15bit， 正 是 sllv 指 令 中 rd 的 位 置 。 


4. lui 指 令 的 译 码 过 程 


OpenMIPS 将 lui 指 令 转 化 为 ori 指 令 来 执行 ， 语 句 如 下 。 


lui rt,immediate = ori rt,$0, (immediate || 0° 


也 就 是 将 指令 中 的 立即 数 左 移 16bit， 然 后 与 $0 寄 存 器 进行 逻辑 
“或 "运算 。 需 要 设置 的 三 方面 内 容 如 下 。 


(1) 要 读 取 的 寄存 器 情况 : 需要 读 取 寄存 器 $0 的 值 ， 所 以 设置 
regl_read_o 为 1、reg2_read_o 为 0。 默 认 通 过 Regfile 模 块 读 端 口 1 读 取 的 


寄存 器 地 址 regl_addr_ o 的 值 是 指令 的 第 21 信 25bit， 参 考 图 5-10 可 知 ， 
正 是 0。 设 置 imm 为 指令 中 的 立即 数 左 移 16 位 的 值 。 


(2) 要 执行 的 运算 : 是 逻辑 * 或 操作， 所 以 alusel MAN 
EXE_RES_LOGIC，aluop_o 赋 值 为 EXE_OR_OP。 


(3) 要 写 入 的 目的 寄存 器 : lui 指 令 需 要 将 结果 写 入 目的 寄存 
器 ， 所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 
地 址 ， 默 认 是 指令 字 的 第 11 人 15bit， 在 此 需要 修改 ， 对 lui 指 令 而 言 ， 
目的 寄存 器 地 址 是 指令 字 的 第 16~20bit。 


5。sll 指 令 的 译 码 过 程 


sl 指令 译 码 需要 设置 的 三 个 方面 内 容 如 下 (srl、sra 指 令 的 译 码 过 
程 可 以 参考 sl 指令 ) 。 


(1) 要 读 取 的 寄存 器 情况 : sl 指令 只 需要 读 取 rt 寄存 器 的 值 ， 所 
以 设置 regl_read_o 为 0、reg2_read_o 为 1。 默 认 通 过 Regtfile 模 块 读 端 口 2 
读 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 指令 的 第 16 一 20bit， 正 是 sl 指令 
中 的 rt。imm 就 是 指令 中 的 第 6 一 10bit 的 值 ， 参 考 图 5-11 可 知 ， 正 是 移 
位 位 数 sa 的 值 。 


(2) 要 执行 的 运算 : sll 指 令 要 进行 的 是 逻辑 左 移 操作 ， 所 以 设置 
alusel_ 0 为 EXFE_RES_ SHIFT， 设 置 aluop_o 为 EXE_SLL_OP。 
(3) 要 写 入 的 目的 寄存 器 : sll] 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 


所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 地 
址 ， 等 于 指令 字 的 第 11~ 人 15bit， 正 是 sl 指令 中 rd 的 位 置 。 


5.5.2 ”修改 执行 阶段 的 EX 模块 


修改 执行 阶段 EX 模块 的 代码 ， 主 要 修改 内 容 如 下 ， 完 整 的 代码 可 
以 参考 本 书 光 盘 中 Code\Chapter5_2 目 录 下 的 ex.v 文 件 。 


module ex( 

); 
reg[ RegBus] logicout; // 保存 逻辑 运算 结 
reg[ RegBus] shiftres; // 保存 移 位 运算 结 


// 进行 逻辑 运算 
always @ (*) begin 
if(rst == “RstEnable) begin 
logicout <= "ZeroWord; 
end else begin 
case (aluop_i) 
“EXE_OR_OP: begin // 逻辑 或 运算 
logicout <= reg1_i | reg2_i; 
end 
“EXE_AND_OP: begin // 逻辑 与 运算 
logicout <= reg1_i € reg2_i; 
end 
“EXE_NOR_OP: begin // 逻辑 或 非 运 算 


logicout <= -(reg1_i |reg2_i); 


endmodule 


上 述 代 码 主要 是 扩展 了 逻辑 运算 的 过 程 ， 同 时 增加 了 进行 移 位 运 
算 的 过 程 ， 最 后 ， 依 据 alusel_i 的 值 ， 选 择 其 中 逻辑 运算 或 移 位 运算 的 
结果 作为 最 终 运算 结果 。 


5.6 ”测试 程序 1 一 一 测试 逻辑 操作 


实现 效果 


编写 如 下 测试 程序 用 于 检验 逻辑 操作 指 
在 本 


命 名 为 


.Org 0x0 

.global _start 
.Set noat 

_Start: 

lui $1,0x0101 
ori $1,$1,0x0101 
ori $2,$1,0x1100 
or $1,$1,$2 
andi $3,$1,0x00fe 
and $1,$3,$1 
xori $4,$1,0xff00 


inst_rom.S 


HE + + + HF HK + 


$1 
$1 
$2 
$1 
$3 
$1 
$4 


0x01010000 


$1 
$1 
$1 
$1 
$3 
$1 


| 0x0101 
| 0x1100 
| $2 
& Ox00fe 
& $1 
A Oxff00 


WA E 
SEG 


By 


正确 实现 ， 文 件 名 
光 $ 中 
Code\Chapter5_2\AsmTestALogicInstTest 目 录 下 有 测试 程序 的 源 文件 。 


0x01010101 
0x01011101 
0x01011101 
0x00000000 
0x00000000 
Ox0000Ff00 


xor $1,$4,$1 # $1 = $4 ^ $1 = 0x0000F FOO 
nor $1,$4,$1 # $1 = $4 ~^ $1 = oxffrfooff 


在 程序 的 注释 中 给 出 了 程序 预期 的 执行 效果 ， 在 这 里 就 是 寄存 器 
$1 一 $4 的 变化 情况 。 将 上 述 inst rom.S 文 件 与 第 4 章 建 立 的 
Bin2Mem.exe、 Makefile、ram.ld 这 三 个 文件 复制 到 Ubuntu 虚 拟 机 中 的 
同一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make 
all， 即 可 得 到 用 于 ModelSim 仿 真 的 inst_rom.data 文 件 。 


在 ModelSim 中 新 建 一 个 工程 ， 添 加 本 书 光 盘 中 Code\Chapter5_2 目 
录 下 的 所 有 .vv 文件， 然后 可 以 编译 。 再 将 上 面 得 到 的 inst_rom.data 文 件 
复制 到 ModelSim 工 程 的 目录 下 ， 融 可 以 进行 仿真 了 。 上 述 仿真 步骤 以 
后 不 再 重复 说 明 。 


ModelSim 仿真 结果 如 图 5-16 所 示 regs[1]. regs[2]. regs[3]. 
regs[4] 分 别 是 寄存 器 $1、$2、$3、$4， 观 察 这 4 个 寄存 器 值 的 变化 ， 可 
知 符合 预期 ， 所 以 OpenMIPS 正 确实 现 了 逻辑 操作 指令 。 


» rst sto 

2 ck sti CA enge el] 
gė regfile1/regs[1] |ffffooff 01010000 101010101 1011101 0000000 boooffoo_}ArFFooff 
B® regfile1/regs[2] |01... (01011101 
EÈ regfilet/regs[3] |00... {D0000000 
B® regfile1/regs[4] |000... ‘boooffoo 


图 5-16 ”逻辑 操作 指令 测试 例 程 仿真 效果 


5.7 ”测试 程序 2 一 一 测试 移 位 操作 
与 空 指令 实现 效果 


42S HOT SE BF RE SS 
fF 名 tk 
Code\Chapter5_2\AsmTest\ShiftInstTest 目 录 下 有 测试 程序 的 产 文 件 。 


然 


JANN 


.Org 0x0 


,Set noat 


.global _start 


eStart: 
lui 
ori 
ori 
ori 
ori 
sync 
sll 
sllv 
srl 
srlv 
nop 
pref 
sll 
ssnop 
sra 


srav 


$2,0x0404 


A 
AR 


名 


# 


$2,$2,0x0404 # 


$7, $0, 0x7 
$5, $0, 0x5 
$8, $0, 0x8 


$2, $2,8 
$2, $2, $7 
$2, $2,8 
$2, $2, $5 


$2, $2,19 


$2, $2,16 
$2, $2, $8 


+ + + + 


# 


# 


为 


$2 = 
$2 = 


$2 = 
$2 = 
$2 = 
$2 = 


$2 = 


$2 = 
$2 = 


inst_rom.S 


0x04040000 
0x04040000 


0x40404040 
0x04040400 
0x02020000 
0x00020200 


0x00001010 


0x80800000 
Oxffff8080 


? 


在 


本 


| 0x0404 


sll 
sll 
srl 


srl 


sll 


sra 


sra 


a co N oO 


19 


16 


目 令 是 否 正确 实现 
盘 


书 3 


= 0x04040404 


0x04040400 
0x02020000 
0x00020200 
0x00001010 


0x80800000 


Oxffff8080 
Oxffffff80 


在 程序 的 注释 中 给 出 了 程序 预期 的 执行 效果 ， 主 要 就 是 寄存 器 $2 


的 变化 情况 。ModelSim 仿 真 结 


果 如 图 5-17 所 示 ， 观 察 寄存 器 $2 的 变化 


可 以 知道 OpenMIPS 正 确实 现 了 移 位 操作 指令 与 空 指令 。 


® rst sto 

de dk IM [ling Pe er ar id (pi em! Fry ee | 训 
5-4 reafilet/regs[2] foo... }04040000 如 3040404 上 040400 如 2020000 加 0020200 
» rst sto 

© dk 


i UA (en [a A FT Sa (ear) ES a LOA ea FE | 
eof) 8 


af reafile1/regs[?] 
5-17 移 位 操作 指令 与 空 指 令 的 测试 程序 仿真 结 
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本 章 首先 分 析 了 流水 线 中 存在 的 数据 相关 问题 ， 然 后 使 用 数据 前 
推 的 方法 解决 了 数据 相关 问题 ， 随 后 修改 OpenMIPS， 实 现 了 对 逻辑 、 
移 位 操作 和 空 指令 的 支持 ， 主 要 修改 的 是 译 码 阶段 的 ID 模块 、 执 行 阶 
段 的 EX 模块 。 其 中 ， 在 ID 模 块 添加 对 新 指令 的 译 码 ， 在 EX 模块 添加 
对 新 的 运算 类 型 的 支持 。 


第 6 章 ”移动 操作 指令 的 实现 


本 章 将 实现 移动 操作 指令 ， 首 先 在 6.1 节 介绍 了 MIPS32 指 令 集 架构 
中 定义 的 移动 操作 指令 的 格式 、 作 用 ， 接 着 在 6.2 节 给 出 移动 操作 指令 
的 实现 思路 ， 介 绍 了 修改 后 的 数据 流 图 、 新 出 现 的 数据 相关 问题 及 其 
解决 措施 ， 并 给 出 了 修改 后 的 OpenMIPS 系 统 结构 图 。 在 6.3 节 列 出 了 详 
细 的 修改 过 程 。 本 章 最 后 通过 一 个 测试 程序 验证 移动 操作 指令 是 否 正 
确实 现 。 


6.1 ”移动 操作 指令 说 明 


MIPS32 指 令 集 架构 中 定义 的 移动 操作 指令 共有 6 条 : movn、 
movz、mfhi、mthi、mflo、mtlo， 后 4 条 指令 涉及 对 特殊 寄存 器 HI、LO 
的 读 / 写 操作 。 截 止 到 本 章 ， 我 们 的 OpenMIPS 处 理 器 只 实现 了 32 个 通用 
寄存 器 以 及 PC， 所 有 的 指令 也 只 是 对 32 个 通用 寄存 器 进行 操作 ， 还 没 
有 涉及 特殊 寄存 器 ， 本 章 将 实现 HI、LO 这 两 个 特殊 寄存 器 。 


HI、LO 寄 存 器 用 于 保存 乘法 、 除 法 结果 。 当 用 于 保存 乘法 结 
时 ，HI 寄 存 器 保存 结果 的 高 32 位 ，LO 寄 存 器 保存 结果 的 低 32 位 ; 当 用 
于 保存 除法 结果 时 ，HI 寄 存 器 保存 余数 ，LO 寄 存 器 保存 商 。 在 后 续 “ 算 
术 操 作 指令 的 实现 ”一 章 中 ， 会 进一步 说 明 。 


这 6 条 移动 操作 指令 的 格式 如 图 6-1 所 示 。 


31 26 25 21 20 16 15 11 10 6 5 0 


SPECIAL MOVN 


000000 u. i rd 00000 00101] | movn 指 令 
|, E rt rd 00000 ro | movz 指 令 
See, 00000 00000 rd 00000 ne mflo 指 令 
q |) # 00000 | 00000 | 00000 A | mthi 指 令 
er rs 00000 00000 00000 a mtlofe > 


图 6-1 移动 操作 指令 的 格式 


从 图 6-1 可 知 ， 这 6 条 指令 都 是 R 类 型 指令 ， 并 且 指 令 码 都 是 
6b000000， 即 均 为 SPECIAL 类 指令 ; 同时 ， 指 令 第 6 一 10bit 都 为 0， 可 
以 依据 指令 中 第 0 一 5bit 功 能 码 的 值 判 断 是 哪 一 种 指令 。 各 指令 的 用 法 
及 作用 说 明 如 下 。 


。 当 功 能 码 为 6b001011 时 ， 表 示 是 movn 指 令 。 
指令 用 法 为 : movn rd, rs, rto 


指令 作用 为 : if rt xz0thenrd<-rs， 判 断 地 址 为 rt 的 通用 寄存 器 的 
值 。 如 果 不 为 零 ， 那 么 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 地 址 为 rd 的 通 
用 寄存 器 ; 反之 ， 保 持 地 址 为 rd 的 通用 寄存 器 不 变 。movn 是 Move 


Conditional on Not Zero 的 意思 。 
。 当 功 能 码 为 6b001010 时 ， 表 示 是 movz 指 令 。 


指令 用 法 为 : movz rd, rs, rto 


指令 作用 为 : ifrt=0thenrd<-rs， 与 上 面 movn 指 令 的 作用 正好 相 
反 ， 判 断 地 址 为 rt 的 通用 寄存 器 的 值 。 如 果 为 零 ， 那 么 将 地 址 为 rs 的 通 
用 寄存 器 的 值 赋 给 地 址 为 rd 的 通用 寄存 器 ; 反之 ， 保 持 地 址 为 rd 的 通用 


寄存 器 不 变 。movz 是 Move Conditional on Zero 的 意思 。 
。 当 功 能 码 为 6b010000 时 ， 表 示 是 mfhi 指 令 。 
指令 用 法 为 : mfhi rd。 


指令 作用 为 : rd <- hi， 将 特殊 寄存 器 HI 的 值 赋 给 地 址 为 rd 的 通用 
寄存 器 。 


。 当 功能 码 为 6b010010 时 ， 表 示 是 mflo 指 令 。 
指令 用 法 为 : mflo rd。 


指令 作用 为 : rd <- lo， 将 特殊 寄存 器 LO 的 值 赋 给 地 址 为 rd 的 通用 
寄存 器 。 


。 当 功 能 码 为 6b010001 时 ， 表 示 是 mthi 指 令 。 
指令 用 法 为 : mthi rs。 


虽 令 作用 为 : hi <- rs， 将 地 址 为 rs 的 通用 宵 存 器 的 值 赋 给 特殊 琳 存 
ás Hlo 


。 当 功 能 码 为 6b010011 时 ， 表 示 是 mtlo 指 令 。 


指令 用 法 为 : mtlorso 


ESFERA: lo <- rs， 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 特殊 寄存 
28LOo 


6.2 ”移动 操作 指令 实现 思路 


这 6 条 移动 操作 指令 可 以 分 为 两 类 : 一 类 是 不 涉及 特殊 寄存 器 HI、 
LO 的 指令 ， 包 括 movn、movz; 另 一 类 是 涉及 特殊 寄存 器 HI、LO 的 指 
令 ， 包括 mfhi、mflo、mthi、mtlo。 前 一 类 很 好 实现 ， 基 本 思路 与 第 5 
章 实现 逻辑 、 移 位 操作 指令 时 类 似 ， 只 需要 修改 ID、EX 模 块 即 可 。 后 

一 类 涉及 特殊 麻 存 器 HI、LO， 需 要 为 OpenMIPS 添 加 HI、LO 寄 存 器 ， 
以 及 相应 的 读 / 写 控制 。 下 面 分 别 介绍 各 自 的 实现 思路 。 


1. movn、 movz 指 令 实现 思路 


与 第 5 章 人 逻辑 、 移 位 操作 指令 的 实现 过 程 类 似 。 


(1) 在 译 码 阶 段 给 出 运算 类 型 alusel_o、 运 算 子 类 型 aluop_o、 要 
写 入 的 目的 寄存 器 地 址 wd_o 等 信号 的 值 ， 同 时 读 取 地 址 为 rs、rt 的 通用 
寄存 器 的 值 ， 但 是 这 里 需要 新 增 一 个 步骤 : O 
存 器 的 值 是 否 为 0， 判 断 是 否 要 写 入 目的 寄存 器 。 将 上 述 结 果 送 到 执行 
阶段 。 


(2) 执行 阶段 依据 传 入 的 信号 ， 确 定 最 终 要 写 入 目的 寄存 器 的 信 
A (包含 : 是 否 写 、 写 入 的 目的 寄存 器 地 址 、 写 入 的 值 ) ， 并 将 这 些 
信息 传递 到 访 存 阶 段 。 


(3) 上 述 信息 会 一 直 传 递 到 回 写 阶段 。 最 后 ， 依 据 这 些 信息 修改 
目的 寄存 器 ， 或 者 不 做 任何 修改 。 


2. mthi、mtlo 指 令 实 现 思 路 
这 2 条 指令 需要 写 HI、LO 寄 存 器 ， 与 之 前 实现 的 通用 寄存 器 一 
样 ， 对 HI、LO 寄 存 器 的 写 操 作 放 在 回 写 阶段 进行 。 


(1) 在 译 码 阶段 依据 指令 ， 给 出 运算 类 型 alusel o、 运 算 子 类 型 
aluop_o 的 值 ， 同 时 读 出 地 址 为 rs 的 通用 寄存 器 的 值 。 由 于 mthi、mtlo 不 
写 通 用 寄存 器 ， 所 以 wreg_o 为 WriteDisable，wd_o 为 0。 


(2) 在 执行 阶段 确定 要 写 HI、LO 寄 存 器 的 情况 ， 以 及 要 写 入 的 
值 ， 并 将 这 些 信息 传递 到 访 存 阶 段 。 


(3) 访 存 阶段 将 这 些 信息 再 传递 到 回 写 阶 段 。 


(4) 回 写 阶段 依据 这 些 信息 修改 HI、LO 寄 存 器 的 值 。 


3。mfhi、mflo 指 令 实 现 思 路 


这 2 条 指令 需要 读 HI、LO 寄 存 器 ， 设 计 在 执行 阶段 才能 读 取 到 。 


(1) 在 译 码 阶段 依据 指令 ， 给 出 运算 类 型 alusel o、 运 算 子 类 型 
aluop_o 的 值 ， 同 时 因为 有 要 写 入 的 目的 寄存 器 ， 所 以 wreg oÑ 
WriteEnable，wd_o 为 指令 中 rd 的 值 ， 也 就 是 目的 寡 存 器 地 址 。 


(2) 在 执行 阶段 获取 HI 或 LO 寄存 器 的 值 ， 作 为 要 写 入 目的 寄存 
器 的 数据 ， 并 将 这 些 信息 传递 到 访 存 阶段 。 


(3) 访 存 阶段 将 这 些 信息 再 传递 到 回 写 阶 段 。 
(4) 回 写 阶 段 依据 这 些 信息 修改 目的 寄存 器 。 


添加 移动 操作 指令 后 的 数据 流 图 如 图 6-2 所 示 。 


bo 
BE oe 
p He | | | ,| 
Cl 存储 器 
N 
clk 
e 取 指 ss 译 码 J 执行 ye vite AB 


图 6-2 添加 移动 操作 指令 后 的 数据 流 图 
对 比 图 6-2 与 图 5-7 可 以 发 现 有 如 下 区 别 。 


e 增加 了 HILO 寄 存 器 模块 ， 并 且 该 模块 放 在 回 写 阶段 。 

。 将 HI、LO 寄 存 器 的 值 传递 到 执行 阶段 ， 在 执行 阶段 增加 了 一 
个 选择 模块 ， 用 于 选择 要 参与 运算 的 数据 ， 如 果 是 mfhi、mflo 
中 令 ， 那 么 就 会 选择 传递 过 来 的 HI、LO 寄 存 器 的 值 。 


6.2.1 新 的 数据 相关 情况 的 解决 


进一步 考虑 mfhi、mflo 指 令 的 处 理 过程 ， 这 2 条 指令 会 在 流水 线 执 
行 阶段 读 取 HI、LO 寄 存 器 的 值 ， 如 果 直 接 采 用 HILO 模 块 给 出 的 HI、 
LO 寄存 器 的 值 ， 可 能 不 是 正确 的 HI、LO 寄 存 器 的 值 ， 因 为 此 时 处 于 访 
存 、 回 写 阶 段 的 指令 有 可 能 会 修改 HI、LO 寄 存 器 ， 以 如 下 程序 为 例 。 


íl, lui $1,0x0000 # $1 = 0x00000000 
Ze lui $2, Oxffff # $1 = 0xffff0000 
Bo mthi $0 # hi = 0x00000000 
4. mthi $1 # hi = 0x00000000 
Sh mthi $2 # hi = Oxffff0000 
6. mfhi $4 # $4 = 0xffff0000 


指令 3、4、5 均 要 修改 HI 寄存 器 ， 当 指令 6 处 于 执行 阶段 时 ， 指 令 5 
处 于 访 存 阶 段 ， 指 令 4 处 于 回 写 阶 段 ， 而 此 时 HI 寄存 器 的 值 是 指令 3 刚 
刚 写 入 的 0x00000000，HILO 模 块 正 是 将 该 值 传 到 执行 阶段 ， 如 果 采 用 
这 个 值 ， 那 么 就 会 出 错 ， 偏 离 程 序 设想 ， 正 确 的 值 应 该 是 当前 处 于 访 
存 阶 段 的 指令 5 要 写 的 数据 ， 如 图 6-3 所 示 。 


时 钟 / \ \ / \ / \ \ \ / \ 


mthi$O < 取 指 x 译 码 > A A > 


4. mthi SI A MM DLS 


5. mthi $2 <a> > EN als > 
6. mfhi $4 CWE PE ED ID 回 写 > 


图 6-3 ”HI、LO 寄 存 器 带 来 的 数据 相关 示意 图 


un 


似曾相识 ， 是 不 是 ”这 融 是 第 5 章 介绍 过 的 数据 相关 问题 ， 解 决 撞 
施 还 是 使 用 效 据 前 推 。 将 处 于 访 存 阶 段 、 回 写 阶 段 的 指令 对 HI、LO 寄 


存 器 的 操作 信息 反馈 到 执行 阶段 ， 执 行 阶段 依据 这 些 信息 ， 确 定 HI、 
LO 寄存 器 的 正确 值 。 


为 此 ， 需 要 修改 数据 流 图 如 图 6-4 所 示 ， 相 比 图 6-3， 主 要 增加 的 部 
分 就 是 将 访 存 阶 段 、 回 写 阶 段 的 信息 反馈 到 执行 阶段 ， 输 入 到 执行 阶 
段 的 选择 模块 (图 中 粗 线 所 示 ) ， 如 果 处 于 执行 阶段 的 是 mfhi、mflo 指 
令 ， 那 么 就 会 从 中 选择 HI、LO 寄 存 器 的 正确 值 。 


UL» s 
P 指令 | | |_ Parte ae ] | HI 
AX WIE NY N 
E 存储 器 | | | | 器 || 和 ~ ~ > ALU [A Lo 


> a M 
io U U 
Fay | Fix] | 
lage WY 
La N 展 ) | iS a A 
clk | | 
¡HR se 译 码 i 执行 it MS, 


图 6-4 解决 HI、LO 寄 存 器 带 来 的 数据 相关 问题 后 的 数据 流 图 


6.2.2 ”系统 结构 的 修改 


为 了 实现 移动 操作 指令 需要 对 OpenMIPS 系 统 结构 进行 补充 完善 ， 
主要 修改 如 图 6-5 所 示 。 


EX EX/MEM MEM MEM/WB HILO 
A hi_i hil Ra ex_whil hilo > whil whilo í > _whil b_whilo ~ wi 
> lo_i I > ex_hi mem hi a h hi_o Hp» wh_hi — md hii h 
¡2 wb_whilo 1 Ha ex_lo em_lo >| lo lo í > 1 wb_lo H- | >| 1 
¡PP wh hi i a 
li > wb mem.v Ik 
| pir whil ex_mem.v mem_wb.y hilo_reg.v 
| m> mem_hi_i ! | 
> n_lo_i 
1 
l 


ae re 
|Esse=eoreresessoncecsersorcrpessrescorsessscerssssrecoerescerasessssss! 


OpenMIPS 结 构图 
(为 实现 移动 操作 指令 而 做 的 修改 ) 


图 6-5 ”为 实现 移动 操作 指令 而 对 OpenMIPS 系 统 结构 所 做 的 修改 


主要 有 三 个 方面 。 
(1) 增加 了 HILO 模 块 ， 用 于 实现 HI、LO 寄 存 器 。 


(2) 执行 阶段 的 EX 模块 增加 了 whilo_o、hi_o、lo_o 接 口 ， 分 别 表 
示 是 否 要 写 HILO、 要 写 入 HI 寄存 器 的 值 、 要 写 入 LO 寄存 器 的 值 。 这 三 
个 接口 传递 出 来 的 对 HL、LO 寄 存 器 的 修改 信息 会 通过 EX/MEM、 
MEM、MEM/WB 三 个 模块 一 直 传 递 到 回 写 阶 段 ， 并 最 终 传 递 给 HILO 
模块 。 


(3) 执行 阶段 的 EX 模块 增加 了 与 H、LO 寄 存 器 有 关 的 输入 接 
口 ， 包 括 为 解决 HI、LO 寄 存 器 的 数据 相关 问题 而 引入 的 接口 ， 在 6.3.3 
节 会 有 详细 介绍 。 


6.3 ”修改 OpenMIPS 以 实现 移动 操 
作 指 令 


6.3.1 HI、LO 宕 存 器 的 实现 


在 HILO 模 块 中 实现 HI、LO 寄 存 器 ，HILO 模 块 的 接口 描述 如 表 6-1 
所 示 。 


表 6-1 ”HILO 模块 的 接口 


输入 /输出 
输入 


输入 


HI, LO 寄存 器 写 使 能 信号 


i 

要 写 入 HI 寄存 器 的 值 
BEA LO 寄存 器 的 值 

HI 寄存 器 的 值 

LO 寄存 器 的 值 


HILO 模 块 的 代码 如 下 ， 源 文件 是 本 书 附带 光盘 中 Code\Chapter6 目 
录 下 的 hilo_reg.v。 整 个 代码 很 简单 : 在 时 钟 上 升 治 ， 如 果 复 位 信号 无 
效 ， 那 么 就 判断 输入 的 写 使 能 信号 we 是 否 为 WriteEnable， 如 果 是 
WriteEnable ， 那 么 就 将 输入 的 hi i、lo_i 的 值 作 为 HI、LO 寄 存 器 的 新 
值 ， 并 通过 hi _o、1lo_o 接 口 输出 。 


module hilo_reg( 


input wire clk, 
input wire rst, 
// 5m0 

input wire we, 
input wire[ RegBus ] hi_i, 
input wire[ RegBus] losin 


output reg[ RegBus] hi_o, 


output reg[ RegBus] lo_o 


always @ (posedge clk) begin 

if (rst == "RstEnable) begin 
hi_o <= Zeroword ， 
lo_o <= "ZeroWord; 

end else if((we == "WriteEnable)) begin 
hito <= hala 
1’920=<=71021, 

end 


end 


endmodule 


6.3.2 ”修改 译 码 阶段 的 ID 模块 


在 译 码 阶段 要 增加 对 移动 操作 指令 的 分 析 ， 根 据 图 6-1 给 出 的 移动 
操作 指令 格式 可 知 ， 这 6 条 指令 都 是 SPECIAL 类 指令 ， 且 第 6 人 10bit 均 
为 0， 需 要 依据 第 0 一 5bit 的 功能 码 确 定 指令 ， 确 定 指令 的 过 程 如 图 6-6 
所 示 。 


= EXE_SPECIAL_INST 
> 


其 中 涉及 的 安定 义 如 下 ， 正 是 图 6-1 中 各 个 指令 的 功能 码 。 在 本 书 
附带 光盘 中 Code\Chapter6 目 录 下 的 defines.v 文 件 中 可 以 找到 这 些 宏 定 


Xo 


`define 
“define 
“define 
“define 
“define 


“define 


译 码 阶段 的 人 D 模 块 主要 修改 如 下 。 完 整 代码 位 于 本 书 附带 光 盘 中 


i 


tesis 


wire[5:0] op = inst_i[3 1:26]; 
wire[4:0] op2 = inst_i[10:6]; 
wire[5:0] op3 = inst_i[5:0]; 
wire[4:0] op4 = inst_i[20:16]; 


EXE_MOVZ 
EXE_MOVN 
EXE_MFHI 
EXE_MTHI 
EXE_MFLO 
EXE_MTLO 


图 6-6 ”确定 移动 操作 指令 的 过 程 


6'b001010 
6'b001011 
6'b010000 
6'b010001 
6'b010010 
6'b010011 


Code\Chapter6 目 录 下 的 id.v 文 件 。 


module id( 


wire[5:0] op 


wire[4:0] op2 


wire[5:0] op3 


inst_i[31:26]; 
inst_i[10:6]; 
inst_i[5:0]; 


= EXE MOVN 
= > movn 指 今 

=EXE MOVZ 
二 movz 指 令 

= EXE MTHI 
= mthi 指 令 

= EXE_MTLO 
mtlo 指 令 

一 EXE MFHI 
= mfhi 指 令 

=EXE MFLO 
mflo 指 令 

. ...... 


endmodule 


AYO BIL Ait AB. 


(1) 除 mthi、mtlo 外 的 其 余 4 条 移动 操作 指令 的 运算 类 型 alusel o 
均 为 EXE_RES_MOVE。 


(2) 指令 mthi、mtlo 需 要 修改 HI、LO 寄 存 器 ， 但 是 不 需要 修改 通 
用 寄存 器 ， 所 以 在 其 译 码 结果 中 ，wreg_o 为 WriteDisable。 另 外 ， 设 置 
regl_read_o 为 1， 表 示 需 要 通过 Regfile 模 块 读 端口 1 读 取 通用 寄存 器 的 
值 ， 默 认 读 取 地 址 就 是 指令 第 21~25bit 的 值 ， 正 是 mthi、mtlo 指 令 中 的 
rs。 读 出 的 值 作为 要 写 入 HI 或 LO 寄存 器 的 数据 。 


(3) movz 指 令 的 译 码 过 程 需要 读 取 rs、rt 寄 存 器 的 值 ， 所 以 设置 
regl_read_o、reg2_read_o 均 为 1。 默 认 通 过 Regfile 模 块 读 端口 1 读 取 的 
寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 movz 指 令 中 的 
rs， 默 认 通 过 Regfile 模 块 读 端口 2? 读 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 
指令 的 第 16 一 20bit， 正 是 movz 指 令 中 的 rte。 所 以 ，reg2_o 的 值 就 是 读 取 
到 的 地 址 为 rt 的 寄存 器 的 值 ， 如 果 该 值 为 0， 那 么 设置 wreg_o 为 
WriteEnable， 表 示 要 将 地 址 为 rs 的 寄存 器 的 值 赋 给 地 址 为 rd 的 寄存 器 ， 
反之 ，wreg_o 为 WriteDisable， 表 示 不 赋值 。 


(4) movn 指 令 的 译 码 过 程 与 novz 指 令 类 似 ， 只 是 wreg_o 为 


WriteEnable 的 条 件 与 novz 正 好 相反 。 


6.3.3 ”修改 执行 阶段 


1. 修改 EX 模块 


译 码 阶段 的 结果 会 传递 到 执行 阶段 ， 执 行 阶段 据 此 进行 计算 。 考 
虑 到 执行 阶段 需要 读 写 HI、LO 寄 存 器 ， 另 外 还 要 解决 H、LO 寄 存 器 带 
来 的 数据 相关 问题 ， 所 以 需要 给 EX 模块 增加 如 表 6-2 所 示 的 接口 。 各 接 
口 对 外 连接 关系 可 以 参考 图 6-5。 


表 6-2 EX 模块 要 增加 的 接口 


输入 /输出 作 FA 

输入 ) 模块 给 出 的 HI 寄存 器 的 值 

MA 黄 块 给 出 的 LO 寄存 器 的 值 

今 是 否 要 写 HI, LO 寄存 器 


令 要 写 入 HI 寄存 器 的 值 
令 要 写 入 LO 寄存 器 的 值 
EREE H, LO 寄存 器 


令 要 写 入 HI 寄存 器 的 值 


令 要 写 入 LO 寄存 器 的 值 
r 要 写 HI, LO oy 存 器 
令 要 写 入 HI 寄存 器 的 值 


令 要 写 入 LO 寄存 器 的 值 


EX 模块 的 代码 修改 如 下 。 完 整 代码 位 于 本 书 附 带 光 盘 中 
Code\Chapter6 目 录 下 的 ex.v 文 件 中 。 


module ex( 


// HIL0 模 块 给 出 的 HI、L0 寄 存 器 的 值 
input wire[ RegBus ] hi_i, 


input wire[ RegBus] Ioi; 


whilo_o <= "WriteEnable; 


hi_o <= regi_i; 
1980 z= 0; // 写 HI 寄 存 器 ， 所 以 LO 保持 不 变 
end else if(aluop_i == “EXE_MTLO_OP) begin 


whilo_o <= "WriteEnable; 
hi_o <= HI; // 写 L0 寄 存 器 ， 所 以 HI 保持 不 变 
lo_o <= reg1_i; 

end else begin 


whilo_o <= "WriteDisable; 


hi_o <= "ZeroWord; 
lo_o <= "ZeroWord; 
end 
end 
endmodule 


上 面 修改 的 代码 可 以 分 为 四 段 理 解 。 


(1) 第 一 段 代码 的 作用 是 得 到 最 新 的 HI、LO 寡 存 器 的 值 ， 首 先 
判断 当前 处 于 访 存 阶段 的 指令 是 否 要 写 HI、LO 寄 存 器 ， 即 
mem_whilo_o 是 否 为 WriteEnable， 如 果 是 ， 那 么 访 存 阶段 的 指令 要 写 入 
的 值 就 是 HI、LO 寄 存 器 的 最 新 值 ， 如 果 不 是 ， 那 么 再 判断 当前 处 于 回 
写 阶 段 的 指令 是 否 要 写 HI、LO 寄 存 器 ， 如 果 是 ， 那 么 回 写 阶段 的 指令 
要 写 入 的 值 就 是 HI、LO 寄 存 器 的 最 新 值 ， 如 果 不 是 ， 那 么 从 HILO 模 块 
输入 的 值 hi_ i、lo_i 就 是 HI、LO 寄 存 器 的 最 新 值 。 


(2) 第 二 段 代码 的 作用 是 针对 不 同 的 移动 操作 指令 ， 确定 
moveres 的 值 ， 变 量 moveres 存 储 的 是 移动 操作 指令 的 结果 。 


(3) 第 三 段 代码 的 作用 是 依据 运算 类 型 alusel_i 的 值 ， 将 不 同 的 运 
算 结 果 赋 给 wdatao ， 如 果 是 移动 操作 指令 ， 那 么 auseli 为 
EXE_RES_MOVE， 此 时 将 moveres 的 值 赋 给 wdata_o。 


(4) 第 四 段 代码 的 作用 是 确定 是 否 要 写 HI、LO 寄 存 器 ， 如 果 是 
mthi、mtlo 寄 存 器 ， 那 么 要 写 HI、LO 寄 存 器 ， 所 以 设置 输出 信号 
whilo_o 为 WriteEnable。 具 体 地 说 ， 有 如 下 两 种 情况 。 


。 如 果 是 mthi 指 令 ， 那 么 表示 要 写 HI 寄 存 器 ， 所 以 hi_o 等 于 
regl_i 的 值 ， 参 考 译 码 阶段 的 ID 模块 可 知 ，regl_i 的 值 就 是 在 
译 码 阶段 读 出 的 地 址 为 rs 的 寄存 器 的 值 。 另 外 ，LO 的 值 保持 
变 ， 所 以 lo_o 等 于 LO。 

如 果 是 mtlo 指 令 ， 那 么 表示 要 写 LO 寄 存 器 ， 所 以 lo_o 等 于 
regl_i 的 值 ， 参 考 译 码 阶段 的 ID 模块 可 知 ，regl_i 的 值 就 是 在 
译 码 阶段 读 出 的 地 址 为 rs 的 寄存 器 的 值 。 另 外 ，HI 的 值 保持 不 
变 ， 所 以 hi_o 等 于 HI。 


2. 修改 FX/MEM 模 块 


参考 图 6-5，EX 模 块 新 增加 的 输出 接口 whilo_o、hi_o、1o_o 连 接 到 
EX/MEM 模 块 ， 需 要 给 EX/MEM 模 块 添加 如 表 6-3 所 示 的 接口 。 


表 6-3 EX/MEM 模 块 要 增加 的 接口 


FR 号 | 接口 名 RE (bit) 输入 /输出 E E 
j ex whilo 输入 央行 阶段 的 指令 是 否 要 写 HL, LO 寄存 器 
2 ex hi 2 输入 行 阶段 的 指令 要 写 入 HI 寄存 器 的 值 


32 输入 丸 行 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
32 输出 访 存 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
32 输出 访 存 阶段 的 指令 要 写 入 LO 寄存 器 的 值 


EX/MEM 模 块 的 代码 修改 如 下 ， 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter6 目 录 下 的 ex_mem.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 笠 
体 表 示 ， 作 用 是 将 执行 阶段 得 到 的 对 HI、LO 寄 存 器 的 写 信息 传递 到 访 
存 阶 段 。 


6.3.4 ”修改 访 存 阶段 
1. 修改 MEM 模 块 


参考 图 6-5，EX/MEM 模 块 新 增加 的 输出 接口 mem whilo、 
mem_hi、mem_ lo 连接 到 访 存 阶段 的 MEM 模 块 ， 需 要 给 MEM 模 块 添 加 
如 表 6-4 所 示 的 接口 。 


表 6-4 ”MEM 模块 要 增加 的 接口 


阶段 的 指令 是 否 要 写 H LO 寄存 器 


whilo i 


3 从 访 存 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
和 加 访 存 阶段 的 指令 最 终 是 否 要 写 HI, LO 寄存 器 


eo ist ern 

lo o 3 mE VTE EIFS RAEE A LO 寄存 器 的 值 
MEM 模 块 的 代码 修改 如 下 。 对 应 本 书 附带 光盘 中 Code\Chapter6 目 
录 下 的 mem.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 和 斜体 表示 ， 作 用 是 将 对 


HI、LO 寄 存 器 的 写 信 息 传 递 到 MEM/WB 模 块 ， 后 者 会 将 这 些 信息 传递 
到 回 写 阶段 。 


32 ‘i 沪 存 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
一 

i I 

5 

6 


module mem( 


input wire rst, 


// 来 自 执行 阶段 的 信息 


input wire[ RegAddrBus] wd_i, 


input wire wreg_i, 


2。 修 改 MEMVWB 模 块 


参考 图 65，MEM 模 块 新 增 的 输出 接口 whilo_o、hi_o、lo_o 连 接 到 
MEM/WB 模 块 ， 需 要 给 MEM/WB 模 块 添 加 如 表 6-5 所 示 的 接口 。 


表 6-5 MEM/WB 模 块 要 增加 的 接口 


| FA 


| 访 丰 阶段 的 指令 是 否 要 写 HU、LO 寄存 器 。 
BHIIR EIEE HI FEIN 
SIR SBE A LO 寄存 器 的 人 


wb_whilo 


段 的 指令 是 否 要 写 H, LO 寄存 器 


wb hi 


段 的 指令 要 写 入 HI 寄存 器 的 值 


wb_lo 


段 的 指令 要 写 入 LO 寄存 器 的 值 


MEM/WB 模块 的 代码 修改 如 下 。 对 应 本 书 附 带 光 盘 中 
Code\Chapter6 目 录 下 的 mem_wb.v 文 件 。 主 要 修改 的 部 分 使 用 加 粗 、 科 
体 表示 ， 作 用 是 将 对 HI、LO 寄 存 器 的 写 信 息 传递 到 回 写 阶段 。 


6.3.5 ”修改 回 写 阶段 


参考 图 6-5，MEM/WB 模 块 输出 的 对 HI、LO 寄 存 器 的 写 信 息 将 直 
接送 到 HILO 模 块 ， 包 括 : wb_whilo、wb hi、wb lo， 后 者 据 此 修改 
HI、LO 寄 存 器 的 值 。 


6.3.6 ”修改 OpenMIPS 顶 层 模块 


由 于 本 章 增添 了 HILO 模 块 ， 而 且 对 流水 线 中 的 多 个 模块 都 增加 了 
接口 ， 所 以 需要 修改 OpenMIPS 顶 层 模 块 ， 在 其 中 将 各 个 模块 新 增加 的 
接口 按照 如 图 6-5 所 示 的 关系 连接 起 来 。 因 为 很 好 理解 ， 所 以 具体 代码 
不 在 书 中 罗列 ， 读 者 可 以 参考 本 书 附带 光盘 中 Code\Chapter6 目 录 下 的 
openmips.v 文 件 。 


6.4 ”测试 程序 


本 节 将 通过 一 个 测试 程序 验证 为 OpenMIPS 处 理 器 添加 的 移动 操作 
指令 是 否 实现 正确 ， 测 试 程序 如 下 ， 对 应 本 书 附 带 光 盘 中 
Code\Chapter6\AsmTest 目 录 下 的 inst_rom.S 文 件 。 


.org 0x0 

.Set noat 
.global _start 
_start: 


// 给 寄存 器 $1、$2、$3、$4 赋 初 值 


lui $1,0x0000 # $1 = 0x00000000 
lui $2, Oxffff # $2 = Oxffff0000 
lui $3,0x0505 # $3 = 0x05050000 
lui $4,0x0000 # $4 = 0x00000000 


// 对 于 movz 指 令 而 言 ， 由 于 寄存 器 $1 为 90， 所 以 将 $2 的 值 赋 给 $4 
movz $4,$2,$1 # $4 = Oxffff0000 


// 对 于 movn 指 令 而 言 ， 由 于 寄存 器 $1 为 0， 所 以 不 赋值 ，$4 保 持 不 变 
movn $4,$3,$1 # $4 = Oxffff0000 


// 对 于 movn 指 令 而 言 ， 由 于 寄存 器 $2 不 为 9， 所 以 将 $3 的 值 赋 给 $4 
movn $4,$3,$2 # $4 = 0x05050000 


// 对 于 movz 指 令 而 言 ， 由 于 寄存 器 $3 不 为 90， 所 以 不 赋值 ，$4 的 值 保持 不 变 
movz $4,$2,$3 # $4 = 0x05050000 


// 连续 三 条 mthi 指 令 ， 分 别 将 寄存 器 $0、$2、$3 的 值 保存 到 HI 寄存 器 


mthi $0 # hi = 0x00000000 
mthi $2 # hi = Oxffff0000 
mthi $3 # hi = 0x05050000 


// 读 取 HI 寄 存 器 的 值 到 $4， 同 时 可 验证 HI、L0 寄 存 器 带 来 的 数据 相关 问题 是 否 处 
理 正 确 
mfhi $4 # $4 = 0x05050000 


// 连续 三 条 指令 mt1o， 分 别 将 寄存 器 $3、$2、$1 的 值 保 存 到 LO 寄存 器 


mtlo $3 # lo = 0x05050000 
mtlo $2 # lo = OXffff0000 
mtlo $1 # lo = 0x00000000 


// 读 取 L0 寄 存 器 的 值 到 $4， 同 时 可 验证 HI、L0 寄 存 器 带 来 的 数据 相关 问题 是 否 处 


理 正 确 
mflo $4 # $4 = 0x00000000 


程序 的 注释 给 出 了 预期 效果 ， 将 上 述 inst_rom.S 文 件 与 第 4 章 建立 的 
Bin2Mem.exe、Makefile、ram.]d 这 三 个 文件 复制 到 Ubuntu 虚拟 机 中 的 同 
一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make all, 
即 可 得 到 用 于 ModelSim 仿 真 的 指令 存储 器 初始 化 文件 inst_rom.data。 


在 ModelSim 中 新 建 一 个 工程 ， 添 加 本 书 附 带 光盘 中 Code\Chapter6 
目录 下 的 所 有 .v 文 件 ， 然 后 可 以 编译 。 再 将 上 面 的 inst_rom.data 文 件 复 
制 到 ModelSim 工 程 的 目录 下 ， 就 可 以 进行 仿真 了 。 


ModelSim 仿 真 输出 结果 如 图 6-7、 图 6-8 所 示 ， 观 察 $4、HI、LO 寄 
存 器 值 的 变化 可 以 知道 OpenMIPS 正 确实 现 了 移动 操作 指令 。 


® rst sto 
> ck si II LJ | 
E-e reagfilet/regs[i] 00... fooo00000 
&® regfileifregs[2] |F... ‚fffoooo 
5-4 regfileljregs[3] |05... (05050000 
(+ regfileljregs[ |05... ‘00000000 Jfffo000 05050000 
5-44 hilo_reg0/hi_o 05... 
4 hilo_reg0/o_o 00... 
$4 寄存 器 的 值 从 0x0 变 为 0xffff0000， 并 保持 两 个 时 钟 
周期 ， 然 后 变 为 0x05050000 


图 6-7 ”移动 操作 指令 仿真 测试 结果 1 


O) HILO 模 块 的 输出 hi o， 即 HI 寄存 器 的 值 ， 从 0x0 变 
化 为 0xffff0000， 最 终 变化 为 0x05050000 


® rst sto 

® ck Sti 
1-4 regñlet/regs[1] 00... 
EÈ reafilet/regs[2]_ fff... 
E$ regfilel/regs[3] |05... 
1-4 regfilet/regs[4] 00... 505000 
4 hilo_regd/hi_o |05... [00000000 JFFffoooo 
2-4 hilo_reg0/lo_o foo... 


© HILO 模 块 的 输出 lo o， 即 LO 寄存 器 的 值 ， 从 O $4 寄存 器 最 后 的 值 与 LO | 
0x05050000 变 化 为 0xfffFf0000， 最 终 变 化 为 0x0 寄存 器 一 样 ， 也 为 0x0 o 


图 6-8 ”移动 操作 指令 仿真 测试 结果 2 


第 7 章 ”算术 操作 指令 的 实现 


本 章 将 实现 MIPS32 指 令 集 架 构 定 义 的 所 有 算术 操作 指令 ， 共 有 21 
条 ， 按 照 OpenMIPS 实 现 这 些 指令 的 方式 ， 可 以 分 为 三 类 ， 分别 介绍 如 
下 。 


(1) 简单 算术 操作 指令 


共有 15 条 ， 包 括 加 法 、 减 法 、 比 较 、 乘 法 等 指令 ， 这 些 指令 在 流水 
线 的 执行 阶段 都 只 需要 一 个 时 钟 周 期 ， 而 且 实 现 思 路 很 直观 ， 与 第 4 章 添 
加 逻辑 操作 指令 类 似 ， 只 需 修 改 译 码 阶段 的 症 模 块 、 执 行 阶段 的 EX 模 
块 ， 即 可 实现 。 


(2) RRI RAMES 


共有 4 条 : RAM (madd) 、 无 符号 乘 累 加 (maddu) . RAM 
(msub) 、 无 符号 乘 累 减 (msubu) 。 其 中 madd、maddu 要 求 操 作 数 相 乘 
后 ， 再 与 HI、LO 寄 存 器 的 值 相 加 ，msub、msubu 指 令 要 求 操 作 数 相 乘 
后 ， 再 与 H、LO 寄 存 器 的 值 相 减 。 也 就 是 说 ， 这 4 条 指令 都 要 做 两 次 运 
算 ， 一 次 乘法 、 一 次 加 Ch) 法 ， 如 果 将 这 两 次 运算 放 在 流水 线 执行 阶 
段 的 一 个 时 钟 周 期 中 完成 ， 那 么 会 使 流水 线 执 行 阶段 所 需要 的 时 间 明 显 
增加 ， 从 而 降低 OpenMIPS 工 作 时 钟 的 频率 ， 因 此 ，OpenMIPS 设 计 在 流 
水 线 执行 阶段 使 用 两 个 时 钟 周 期 完成 这 类 指令 ， 一 个 时 钟 周 期 进行 乘 
法 ， 下 一 个 时 钟 周期 进行 加 Om) 法 。 


(3) 除法 指令 


共有 2 条 : 有 符号 除法 (div) 、 无 符号 除法 (divu) 。OpenMIPS 计 
划 采 用 试 商法 完成 除法 运算 ， 对 于 32 位 的 除法 ， 流 水 线 执 行 阶段 至 少 需 


要 32 个 时 钟 周期 。 也 就 是 说 ， 除 法 指令 需要 多 个 时 钟 周期 才能 完成 ， 所 
以 单独 作为 一 类 。 


本 章 将 分 别 介绍 上 述 三 种 类 别 的 算术 操作 指令 的 实现 过 程 。7.1 节 人 ~ 
7.4 玫 给 出 了 简单 算术 操作 指令 的 格式 和 作用 ， 介 绍 了 实现 思路 ， 并 修改 
OpenMIPS 代 码 以 实现 简单 算术 操作 指令 ， 最 后 通过 ModelSim 仿 真 验证 是 
否 实现 正确 。 


因为 乘 累加 、 乘 累 威 、 除 法 指令 都 需要 在 流水 线 执 行 阶段 占用 多 个 
时 钟 周期 ， 这 就 需要 使 流水 线 暂 停 ， 所 以 在 实现 这 些 指令 之 前 ， 先 要 实 
现 流水 线 暂停 ， 在 7.5 节 介绍 了 使 流水 绪 暂 停 的 方法 。 


7.6 节 ~7.9 节 给 出 了 乘 累 加 、 乘 累 减 指令 的 格式 和 作用 ， 介 绍 了 实现 
BE, FHEROpenMIPSHA ATMA, RAMS, RTA 
测试 。 


7.10 节 一 7.13 节 给 出 了 除法 指令 的 格式 和 作用 ， 介 绍 了 实现 思路 ， 并 
修改 OpenMIPS 代 码 以 实现 除法 指令 ， 最 后 进行 仿真 测试。 


7.14 节 给 出 了 实现 算术 操作 指令 后 的 数据 流 图 。 


71 ”简单 算术 操作 指令 说 明 


简单 算术 操作 指令 一 共有 15 条 ， 具 体 包括 : add、addi、addiu、 
addu, sub, subu, clo, cdz, sit, siti, sltiu, situ, mul, mult, multu, & 


指令 的 格式 及 作用 说 明 如 下 。 


1. add、addu、sub、subu、slt、sltu 指 令 


这 6 条 指令 的 格式 如 图 7-1 所 示 ， 从 图 中 可 以 发 现 这 6 条 指令 都 是 R 类 
型 指令 ， 并 且 指 令 码 都 是 6b000000， 即 SPECIAL 类 。 另 外 ， 第 6 一 10bit 都 
为 0， 需 要 依据 指令 中 第 0 人 5bit 功 能 码 的 值 进 一 步 判 断 是 哪 一 种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 

mm, ® rt rd 00000 /ADD | add 指 令 
177 rs rt rd 00000 ADDO | addu 指 令 
“moo | ® rt rd 00000 00010 | sub 指 令 
One ES rt rd 00000 x ie subu 指 令 
“nnn | 2 rt rd 00000 m slt 指 令 

ar | = rt rd 00000 STO | su 指令 


图 7-1 add, addu, sub, subu, slt, sltujf SHTIR 
。 当 功 能 码 是 6b100000 时 ， 表 示 add 指 令 ， 加 法 运算 。 
指令 用 法 为 : add rd, rs, rto 


指令 作用 为 : rd <- rs + rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 进行 加 法 和 运算， 结果 保存 到 地 址 为 rd 的 通用 寄存 器 中 。 
但 是 有 一 种 特殊 情况 : 如 果 加 法 运算 溢出 ， 那 么 会 产生 溢出 异常 ， 同 时 
不 保存 结果 。 


。 当 功 能 码 是 6b100001 时 ， 表 示 addu 指 令 ， 加 法 运算 。 
指令 用 法 为 : addu rd, rs, rto 


指令 作用 为 : rd <- rs + rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 中 。 


与 add 指 令 的 不 同 之 处 在 于 addu 指 令 不 进行 溢出 检查 ， 总 是 将 结果 保存 到 
目的 寄存 器 。 


。 当 功 能 码 是 6'b100010 时 ， 表 示 sub 指 令 ， 减 法 运算 。 
指令 用 法 为 : sub rd, rs, rto 


自 令 作用 为 : rd <- rs - rt， 将 地 址 为 rs 的 通用 宥 存 器 的 值 与 地 址 为 rt 的 
通用 寄存 器 的 值 进 行 减法 运算 ， 结 果 保 存 到 地 址 为 rd 的 通用 寄存 器 中 。 但 
是 有 一 种 特殊 情况 : 如 果 减 法 运算 洪 出 ， 那 么 产生 溢出 异常 ， 同 时 不 保 
存 结果 。 


。 当 功 能 码 是 6b100011 时 ， 表 示 subu 指 令 ， 减 法 运算 。 
指令 用 法 为 : subu rd, rs, rto 


指令 作用 为 : rd <- rs - rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 的 
通用 寄存 器 的 值 进 行 减法 运算 ， 结 果 保存 到 地 址 为 rd 的 通用 寄存 器 中 。 与 
sub 指 令 的 不 同 之 处 在 于 : subu 指 令 不 进行 溢出 检查 ， 总 是 将 结果 保存 到 
目的 寄存 器 。 


。 当 功 能 码 是 6'b101010 时 ， 表 示 slt 指 令 ， 比 较 运 算 。 
指令 用 法 为 : slt rd, rs, rto 


自 令 作 用 为 : rd <- (rs < rt)， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 宥 存 器 的 值 按照 有 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 将 1 
保存 到 地 址 为 rd 的 通用 寄存 器 中 ; 反之 ， 将 0 保存 到 地 址 为 rd 的 通用 寄存 
器 中 。 


。 当 功 能 码 是 6b101011 时 ， 表 示 sltu 指 令 ， 比 较 运 算 。 


指令 用 法 为 : sltu rd, rs, rto 


指令 作用 为 : rd <- as<rD， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 宥 存 器 的 值 按照 无 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 将 1 
保存 到 地 址 为 rd 的 通用 寄存 器 中 ; 反之 ， 将 0 保存 到 地 址 为 rd 的 通用 寄存 
器 中 。 


2. addi、addiu、slti、sltiu 指 令 


这 4 条 指令 的 格式 如 图 7-2 所 示 ， 从 图 中 可 以 发 现 这 4 条 指令 都 是 I 类 型 
指令 ， 能 够 依据 指令 中 第 26~31bit 指 令 码 的 值 判断 是 哪 一 种 指令 。 


31 26 25 21 20 16 15 0 
Atos rs rt immediate addi 指 令 
D rs rt immediate addiu 指 令 
TS rt immediate slti 指 令 
5 are rs rt immediate sltiu 指 令 


图 7-2 addi、addiu、slti、sltiu 指 令 格式 
. 当 指 令 码 是 6b001000 时 ， 表 示 addi 指 令 ， 加 法 运算 。 
指令 用 法 为 : addi rt, rs, immediate. 


指令 作用 为 : rt <- rs + (sign_extended)immediate， 将 指令 中 的 16 位 立 
即 数 进行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 果 保 
存 到 地 址 为 rt 的 通用 寄存 器 中 。 但 是 有 一 个 特殊 情况 : 如 果 加 法 运算 洲 
出 ， 那 么 产生 溢出 异常 ， 同 时 不 保存 结果 。 


. 当 指 令 码 是 6b001001 时 ， 表 示 addiu 指 令 ， 加 法 运算 。 
指令 用 法 为 : addiu rt, rs, immediate. 


指令 作用 为 : rt <- rs + (sign_extended)immediate， 将 指令 中 的 16 位 立 
即 数 进行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 进行 加 法 运算 ， 结 果 保 
存 到 地 址 为 rt 的 通用 寄存 器 中 。 与 addi 指 令 的 区 别 在 于 : addiu 指 令 不 进行 
溢出 检查 ， 总 是 将 结果 保存 到 目的 寄存 器 。 


。 当 指 令 码 是 6'b001010 时 ， 表 示 slti 指 令 ， 比 较 运 算 。 
指令 用 法 为 : slti rt, rs, immediate. 


指令 作用 为 : rt <- (rs < (sign_extended)immediate), 118 3 HB 1611 
立即 数 进 行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 按照 有 符号 数 进行 比 
较 ， 如 果 前 者 大 于 后 者 ， 那 么 将 1 保存 到 地 址 为 rt 的 通用 寄存 器 中 ; 反 
之 ， 将 0 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 


。 当 指 令 码 是 6b001011 时 ， 表 示 sltiu 指 令 ， 比 较 运 算 。 
指令 用 法 为 : sltiu rt, rs, immediate. 


指令 作用 为 : rt<- (rs < (sign_extended)immediate)， 将 指令 中 的 16 位 
立即 数 进 行 符号 扩展 ， 与 地 址 为 rs 的 通用 寄存 器 的 值 按照 无 符号 数 进行 比 
较 ， 如 果 前 者 大 于 后 者 ， 那 么 将 1 保存 到 地 址 为 rt 的 通用 寄存 器 中 ; 反 
之 ， 将 0 保存 到 地 址 为 rt 的 通用 寄存 器 中 。 


3。clo、clz 指 令 


这 2 条 指令 的 格式 如 图 7-3 所 示 ， 从 图 中 可 以 发 现 这 2 条 指令 都 是 R 类 
型 指令 ， 并 且 指 令 码 都 是 6b011100 ， 在 MIPS32 指 令 集 架构 中 表示 
SPECIAL2 类 。 另 外 ， 第 6 一 10bit 都 为 0， 需 要 依据 指令 中 第 0 一 5bit 功 能 码 
的 值 进一步 判断 是 哪 一 种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 


SPECIAL2 CLZ Bek 
011100 rs rt rd 00000 100000 clz 指 令 
SPECIAL2 CLO LA 
011100 rs rt rd 00000 100001 clo 指 令 


图 7-3 do、dlz 指 令 格 式 
。 当 功 能 码 是 6b100000 时 ， 表 示 clz 指 令 ， 计 数 运 算 。 
指令 用 法 为 : clz rd, rs。 


指令 作用 为 : rd <- coun_leading_zeros rs， 对 地 址 为 rs 的 通用 寄存 器 
的 值 ， 从 其 最 高 位 开始 向 最 低位 方向 检查 ， 直 到 遇 到 值 为 “1” 的 位 ， 将 该 
位 之 前 “0” 的 个 数 保存 到 地 址 为 rd 的 通用 寄存 器 中 ， 如 果 地 址 为 rs 的 通用 
寄存 器 的 所 有 位 都 为 0 〈 即 0x00000000) ， 那 么 将 32 保 存 到 地 址 为 rd 的 通 
用 寄存 器 中 。 


。 当 功 能 码 是 6b100001 时 ， 表 示 clo 指 令 ， 计 数 运 算 。 
指令 用 法 为 : clo rd, rs。 


自 令 作 用 为 : rd <- coun_leading_ones rs， 对 地 址 为 rs 的 通用 寄存 器 的 
值 ， 从 其 最 高 位 开始 向 最 低位 方向 检查 ， 直 到 遇 到 值 为 <0” 的 位 ， 将 该 位 
之 前 “1 的 个 数 保存 到 地 址 为 rd 的 通用 寄存 器 中 ， 如 果 地 址 为 rs 的 通用 寄 
存 器 的 所 有 位 都 为 1 (BNOXFFFFFFFF) ， 那 么 将 32 保 存 到 地 址 为 rd 的 通用 
寄存 器 中 。 


4. multu, mult, mulj $ 


这 3 条 指令 的 格式 如 图 7-4 所 示 ， 可 知 这 3 条 指令 都 是 R 类 型 指令 ， 并 
且 mul 指 令 的 指令 码 是 SPECIAL2，mult 和 multu 的 指令 码 是 SPECIAL。 


31 26 25 21 20 16 15 11 10 6 5 0 


SPECIAL2 MUL SR 
011100 rs rt rd 00000 000010 mulf§4 

SPECIAL MULT te 
000000 rs rt 00000 00000 011000 mult 指 令 

SPECIAL MULTU LA 
000000 rs rt 00000 00000 011001 multuf§ 4 


&]7-4 mul, mult, mutlutSg SHA 


. 当 指 令 码 为 SPECIAL2， 功 能 码 为 6b000010 时 ， 表 示 mul 指 令 ， 
乘法 运算 。 
指令 用 法 为 : mul rd, rs, sto 
指令 作用 为 : rd <- rs x rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 为 rt 
的 通用 寄存 器 的 值 作 为 有 符号 数 相 乘 ， 乘 法 结果 的 低 32bit 保 存 到 地 址 为 
rd 的 通用 寄存 器 中 。 
© 当 指 令 码 为 SPECIAL， 功 能 码 为 6b011000 时 ， 表 示 mult 指 令 ， 
乘法 运算 。 
指令 用 法 为 : mult rs, sto 
指令 作用 为 : {hi, lo} <- rs x rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 


为 rt 的 通用 寄存 器 的 值 作为 有 符号 数 相 乘 ， 乘 法 结果 的 低 32bit 保 存 到 LO 
寄存 器 中 ， 高 32bit 保 存 到 HI 寄存 器 中 。 


。 当 指 令 码 为 SPECIAL， 功 能 码 为 6b011001 时 ， 表 示 multu 指 令 ， 
乘法 运算 。 


指令 用 法 为 : multu rs, sto 


指令 作用 为 : (hi lo} <- rs x rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 地 址 
为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 相 乘 ， 乘 法 结果 的 低 32bit 保 人 存 到 LO 
寄存 器 中 ， 高 32bit 保 存 到 HI 寄存 器 中 。 与 mult 指 令 的 区 别 在 于 : multu 指 
令 执行 中 将 操作 数 作为 无 符号 数 进行 运算 。 


7.2 ”简单 算术 操作 指令 实现 思路 


虽然 简单 算术 操作 指令 的 数目 比较 多 ， 有 15 条 ， 但 实现 方式 都 是 相 
似 的 ， 与 前 几 章 逻辑 、 移 位 操作 指令 的 实现 方式 也 很 类 似 ， 不 需要 增加 
新 的 模块 和 新 的 接口 ， 只 需要 修改 流水 线 译 码 阶段 的 ID 模块 、 执 行 阶段 
的 EX 模块 即 可 。 实 现 思路 如 下 。 


(1) 修改 流水 线 译 码 阶 段 的 ID 模块 ， 添 加 对 上 述 简单 算术 操作 指令 
的 译 码 ， 给 出 运算 类 型 alusel o、 运 算 子 类 型 aluop _o、 要 写 入 的 目的 宥 存 
器 地 址 wd_o 等 信息 ; 同时 根据 需要 ， 读 取 地 址 为 rs、rt 的 通用 寄存 器 的 
值 。 


(2) 修改 流水 线 执行 阶段 的 EX 模块 ， 依 据 传 入 的 信息 进行 运算 ， 得 
到 运算 结果 ， 确 定 最 终 要 写 入 目的 寄存 器 的 信息 (BE: 是 否 写 、 写 入 
的 目的 寄存 器 地 址 、 写 入 的 值 ) ， 并 将 这 些 信息 传递 到 访 存 阶段 。 


(3) 上 述 信息 会 一 直 传递 到 回 写 阶段 ， 最 后 修改 目的 寄存 器 。 


73 ”修改 OpenMIPS 以 实现 简单 算 


术 操 作 指令 


7.3.1 ”修改 译 码 阶段 的 ID 模 块 


在 译 码 阶段 要 增加 对 简单 算术 操作 指 
根据 图 7-1 至 图 7-4 可 以 给 出 如 图 7-5 所 示 的 确定 指 


断 出 指令 的 种 类 ， 
类 的 过 程 。 


—EXE_SPECIAL INST 
> 


-EXE_ADD 


令 的 分 析 ， 分 析 的 前 提 是 能 判 


令 种 


op op2 => op3 > add 指 令 
=EXE_ADDU 
= addu 指 令 
=EXE_ADDI =EXE_SUB 
— addij 指 令 sub 指 令 
- EXE_ADDIU = EXE_SUBU 
— addiuf§ > > 4 subu 指 令 Z 
=EXE_SLTI =EXE SLT 
= slti 指 令 | | co... slt 指 令 
=EXE_SLTIU =EXE_SLTU 
= sltiu 指 今 sltu 指 令 
— EXE_MULT 
= mult 指 令 
=EXE MULTU 
一 一 一 一 一 >| multu 指 令 
ec H ...... 
= EXE_SPECIAL2_INST EXE_CLZ 
>| op3 = > clz 指 今 
| — =EXE_CLO a 
wire[5:0] op = inst_i[3 1:26]; 一 一 一 一 > clo 指 令 
wire[4:0] op2 = inst_i[10:6]; 一 EXE_MUL BA 
wire[5:0] op3 = inst_i[5:0]; 中 mul 指 令 
wire[4:0] op4 = inst_i[20:16]; 
图 7-5 ”确定 简单 算术 操作 指令 的 过 程 


其 中 涉及 的 安定 义 如 下 ， 正 是 图 7-5 中 各 个 指 


令 的 指令 码 或 功能 码 。 


在 本 书 附带 光盘 中 Code\Chapter7_1 目 录 下 的 defines.v 文 件 中 可 以 找到 这 些 


宏 定 义 。 


修改 耳 模 块 的 代码 如 下 ， 完 整 代 码 位 于 本 书 附 带 光 盘 中 
Code\Chapter7_1 目 录 下 的 id.v 文 件 。 


对 任 一 条 指令 而 言 ， 译 码 工作 的 主要 内 容 是 : 确定 要 读 取 的 寄存 器 
情况 、 要 执行 的 运算 、 要 写 的 目的 寄存 器 等 三 个 方面 的 信息 。 下 面 对 其 
中 几 个 典型 指令 的 译 码 过 程 进行 解释 。 


1. add 指 令 的 译 码 过 程 


add 指 令 译 码 需要 设置 的 三 方面 内 容 如 下 (addu、sub、subu 指 令 的 译 
码 过 程 可 以 参考 add 指 令 ) 。 


(1) 要 读 取 的 寄存 器 情况 : add 指 令 需 要 读 取 rs、rt 寄 存 器 的 值 ， 所 
以 设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 Regfile 模 块 读 端 口 1 读 取 
的 寄存 器 地 址 reg1_addr_o 的 值 是 指令 的 第 21~25bit， 正 是 add 指 令 中 的 
rs， 默 认 通 过 Regfile 模 块 读 端口 2? 读 取 的 寄存 恬 地 址 reg2_addr_o 的 值 是 指 
令 的 第 16~~20bit， 正 是 add 指 令 中 的 rt 所 以 最 终 译 码 阶 段 的 输出 reg1_o 就 
是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 地 址 为 rt 的 寄存 器 的 值 。 


(2) 要 执行 的 运算 : add 指 令 是 算术 运算 中 的 加 法 操作 ， 所 以 此 处 
将 alusel_o Jit {A 为 EXE_RES_ ARITHMETIC , aluop_o Jk A W 
EXE ADD OP» 


(3) 要 写 入 的 目的 寄存 器 : add 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 
所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 地 址 ， 
默认 是 指令 字 的 第 11~15bit， 正 是 add 指 令 中 的 rd。 


2。addi 指 令 的 译 码 过 程 


addi 指 令 译 码 需要 设置 的 三 方面 内 容 如 下 (addiu、subi、subiu 指 令 的 
译 码 过 程 可 以 参考 addi 指 令 ) o 


(1) 要 读 取 的 寄存 器 情况 : addi 指 令 只 需要 读 取 rs 寄 存 器 的 值 ， 所 
以 设置 regl_read_o 为 1、reg2_read_o 为 0。 默 认 通 过 Regtfile 模 块 读 端 口 1 读 
取 的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 addi 指 令 中 的 
rs。 设置 reg2_read_0 为 0， 表 示 使 用 立即 数 作为 参与 运算 的 第 二 个 操作 
数 。imm 就 是 指令 中 的 立即 数 进 行 符 号 扩展 后 的 值 。 所 以 最 终 译 码 阶段 的 
输出 reg1l1_o 就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 imm 的 值 。 


(2) 要 执行 的 运算 : addi 指 令 是 算术 运算 中 的 加 法 操作 ， 所 以 此 处 
将 alusel_o Jit {A 为 EXE_RES_ ARITHMETIC , aluop_o Jk A W 


EXE_ADDI_OPo 


(3) 要 写 入 的 目的 寄存 器 : addi 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 
所 以 设置 wreg_o 为 WriteEnable， 设 置 要 写 入 的 目的 寄存 器 地 址 wd_o 是 指 
令 中 第 16~20bit 的 值 ， 正 是 addi 指 令 中 的 rt。 


3。slt 指 令 的 译 码 过 程 


slt 指 令 译 码 需要 设置 的 三 方面 内 容 如 下 (sltu 指 令 的 译 码 过 程 可 以 参 
考 slt 指 令 ) o 


(1) 要 读 取 的 寄存 器 情况 : slt 指 令 需 要 读 取 rs、rt 寄 存 器 的 值 ， 所 以 
设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 Regfile 模 块 读 端口 1 读 取 的 
寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 slt 指 令 中 的 rs， 默 
认 通 过 Regfile 模 块 读 端 口 2? 读 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 指令 的 第 
16~20bit， 正 是 slt 指 令 中 的 rt。 所 以 最 终 译 码 阶段 的 输出 reg1_o 就 是 地 址 
为 rs 的 寄存 器 的 值 ，reg2_o 就 是 地 址 为 rt 的 寄存 器 的 值 。 


(2) 要 执行 的 运算 : slt 指 令 是 算术 运算 中 的 比较 操作 ， 所 以 此 处 将 
alusel_o 赋 值 为 EXE_RES_ARITHMETIC，aluop_o 赋 值 为 EXE_SLT_OP。 


(3) 要 写 入 的 目的 寄存 器 : slt 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 所 
以 设置 wreg_0 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 宵 存 器 地 址 ， 默 
认 是 指令 中 第 11~15bit 的 值 ， 正 是 slt 指 令 中 的 rd。 


4. slti 指 令 的 译 码 过 程 


slti 指 令 译 码 需要 设置 的 三 方面 内 容 如 下 (sltiu 指 令 的 译 码 过 程 可 以 
参考 slti 指 令 ) 。 


(1) 要 读 取 的 寄存 器 情况 : slti 指 令 只 需要 读 取 rs 寄存 器 的 值 ， 所 以 
设置 regl_read_o 为 1、reg2_read_o 为 0。 默 认 通 过 Regfile 模 块 读 端口 1 读 取 
的 寄存 器 地 址 reg1_addr_o 的 值 是 指令 的 第 21~~25bit， 正 是 slti 指 令 中 的 
Iso 设置 reg2_read_0 为 0， 表 示 使 用 立即 数 作 为 运算 的 第 二 个 操作 数 。 
imm 就 是 指令 中 的 立即 数 进行 符号 扩展 后 的 值 。 所 以 最 终 译 码 阶段 的 输出 
regl_0 就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 imm 的 值 。 


(2) 要 执行 的 运算 : slti 指 令 是 算术 运算 中 的 比较 操作 ， 所 以 此 处 将 
alusel_o 赋 值 为 EXE_RES_ARITHMETIC，aluop_o 赋 值 为 EXE_SLT_OP。 


(3) 要 写 入 的 目的 寄存 器 : slti 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 所 
以 设置 wreg_o 为 WriteEnable， 设 置 要 写 入 的 目的 寄存 器 地 址 wd_o 是 指令 
中 第 16~20bit 的 值 ， 正 是 slti 指 令 中 的 rt。 


5。mult 指 令 的 译 码 过 程 


mult 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 (multu 指 令 的 译 码 过 程 可 
以 参考 mult 指 令 ) 。 


1) 要 读 取 的 寄存 器 情况 : mult 指 令 需 要 读 取 rs、rt 寄 存 器 的 值 ， 所 
以 设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 Regfile 模 块 读 端口 1 读 取 
的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 mult 指 令 中 的 
rs， 默 认 通 过 Regfile 模 块 读 端口 2? 读 取 的 寄存 恬 地 址 reg2_addr_o 的 值 是 指 
令 的 第 16~20bit， 正 是 mult 指 令 中 的 rt。 所 以 最 终 译 码 阶段 的 输出 reg1_o 
就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 地 址 为 rt 的 寄存 器 的 值 。 


(2) 要 执行 的 运算 : mult 指 令 是 乘法 操作 ， 并 且 乘 法 结果 不 需要 写 
入 通用 青 存 器 ， 而 是 写 入 HI、LO 寄 存 器 ， 所 以 此 处 将 alusel_o 保 持 为 默认 
{BEXE_RES_NOP, aluop_ollii{HAEXE_MULT_OP. 


(3) 要 写 入 的 目的 寄存 器 : mnult 指 令 不 需要 写 通 用 寡 存 器 ， 所 以 设 
置 wreg_o 为 WriteDisable。 


6. mul 指 令 的 译 码 过 程 


mul 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 。 


(1) 要 读 取 的 寄存 器 情况 : mul 指 令 需 要 读 取 rs、rt 寄 存 器 的 值 ， 所 
以 设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 Regfile 模 块 读 端 口 1 读 取 
的 寄存 器 地 址 regl_addr_o 的 值 是 指令 的 第 21 人 25bit， 正 是 mul 指 令 中 的 
rs; 默认 通过 Regfile 模 块 读 端口 2 读 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 指 
令 的 第 16~20bit， 正 是 mul 指 令 中 的 rt。 所 以 最 终 译 码 阶段 的 输出 regl_o 
就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 地 址 为 rt 的 寄存 器 的 值 。 


(2) 要 执行 的 运算 : mul 指 令 是 乘法 操作 ， 并 且 乘 法 结果 是 写 入 通 
用 寄存 器 ， 所 以 此 处 将 alusel _o 赋 值 为 EXE_RES_MUL ，aluop_o 赋 值 为 
EXE MUL OP。 


(3) 要 写 入 的 目的 寄存 器 : mul 指 令 需 要 将 结果 写 入 目的 寄存 器 ， 
所 以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 地 址 ， 
默认 是 指令 字 的 第 11 人 15bit， 正 是 mu 指令 中 的 rd。 


7。clo 指 令 的 译 码 过 程 


clo 指 令 译 码 需 要 设置 的 三 方面 内 容 如 下 (clz 指 令 的 译 码 过 程 可 以 参 


考 clo 指 令 ) o 


(1) 要 读 取 的 寄存 器 情况 : clo 指 令 只 需要 读 取 rs 寄存 器 的 值 ， 所 以 
设置 regl_read_o 为 1、reg2_read_o 为 0。 默 认 通 过 Regfile 模 块 读 端 口 1 读 取 
的 寄存 器 地 址 reg1_addr_o 的 值 是 指令 的 第 21~~25bit， 正 是 clo 指 令 中 的 
rs， 所 以 最 终 译 码 阶 段 的 输出 regl1_o 就 是 地 址 为 rs 的 寄存 器 的 值 。 


(2) 要 执行 的 运算 : clo 指 令 是 算术 运算 中 的 计数 操作 ， 所 以 此 处 将 
alusel_o 赋 值 为 EXE_RES_ARITHMETIC，aluop_o 赋 值 为 EXE_CLO_OP。 


(3) 要 写 入 的 目的 寄存 器 : clo 指 令 需要 将 结果 写 入 目的 寄存 器 ， 所 
以 设置 wreg_o 为 WriteEnable， 设 置 wd_o 为 要 写 入 的 目的 寄存 器 地 址 ， 默 
认 是 指令 字 的 第 11~15bit， 正 是 clo 指 令 中 的 rd。 


7.3.2 ”修改 执行 阶段 的 EX 模块 


译 码 阶段 的 结果 会 传递 到 执行 阶段 ， 执 行 阶 段 的 EX 模块 会 据 此 进行 
运算 ， 所 以 需要 修改 执行 阶段 EX 模块 的 代码 ， 主 要 修改 内 容 如 下 ， 完 整 
代码 可 以 参考 本 书 附带 光盘 中 Code\Chapter7_1 目 录 下 的 ex.v 文 件 。 


module ex( 


reg[ RegBus] logicout; 
reg[ RegBus] shiftres; 


reg[ RegBus] moveres; 


reg[ RegBus] HI; 


reg[ RegBus] LO; 


// 新 定义 了 一 些 变量 


wire ov_sum; // 保存 溢出 情况 
wire reg1_eq_reg2; As eo E = ee 
作 数 
wire reg1_1t_reg2; 11 第 一 个 操作 数 是 否 小 于 第 二 个 操 
作 数 
reg[ RegBus] arithmeticres; 11 保存 算术 运算 的 结 
wire['RegBus] reg2_i_mux; // 保存 输入 的 第 二 个 操作 数 
reg2 i 的 补 码 
wire['RegBus] reg1_i_not; // 保存 输入 的 第 一 个 操作 数 
reg1_i 取 反 后 的 值 
wire['RegBus] result_sum; // 保存 加 法 结 
wire['RegBus] opdatai_mult; // 乘法 操作 中 的 被 乘 数 
wire[ RegBus] opdata2_mult; // 乘法 操作 中 的 乘 数 
wire[ DoubleRegBus] hilo_temp; // 临时 保存 乘法 结果 ， 宽 度 为 64 位 
reg[ DoubleRegBus] mulres; // 保存 乘法 结果 ， 宽 度 为 64 位 


VEREIN O RAD TP SEAR RAD US EARLS UPS LOTS TB 


KKKKKKKKKKEK 第 一 段 : 计算 以 下 5 个 变量 的 值 类 类 类 火炎 类 类 类 类 


A A AR ed ep ee RR 


// (1) 如 果 是 减法 或 者 有 符号 比较 运算 ， 那 么 reg2_i_mux 等 于 第 二 个 操作 数 
// reg2_ i 的 补 码 ， 否 则 reg2_i mux 就 等 于 第 二 个 操作 数 reg2_i 


hi_o <= reg1_i; 
lo_o <= LO; 

end else if(aluop_i == ~EXE_MTLO_OP) begin 
whilo_o <= "WriteEnable; 
hi_o <= HI; 
lo_o <= regi_i; 

end else begin 
whilo_o <= "WriteDisable; 
hi_o <= "ZeroWord; 
lo_o <= "ZeroWord; 

end 


end 


endmodule 


上 面 的 代码 可 以 分 为 五 段 ， 大 部 分 代码 的 含义 都 在 注释 中 给 出 了 详 
细 解 释 ， 以 下 只 做 简要 补充 。 


(1) 第 一 段 代 码 计算 出 如 下 几 个 变量 的 值 。 


reg2_i_mux: 如 果 是 减法 或 者 有 符号 比较 运算 ， 那 么 reg2_i_mux 
等 于 第 二 个 操作 数 reg2_i 的 补 码 ， 否 则 reg2_i_mux 就 等 于 第 二 个 
操作 数 reg2_i。 

result_sum: 加 、 减 法 的 结果 。 

ov_sum: 指示 加 、 减 法 是 否 溢出 。 

regl_lt_reg2: 操作 数 1 是 否 小 于 操作 数 2。 

regli not: 操作 数 1 各 位 取 反 后 的 值 。 


(2) 第 二 段 代 码 依 据 不 同 的 算术 运算 类 型 ， 给 变量 arithmeticres 赋 
值 ， 此 处 只 解释 clz、dlo 指 令 的 运算 过 程 ， 其 余 指令 的 运算 过 程 请 参考 程 
序 注释 。 


。 clz 指 令 的 作用 是 从 最 高 位 开始 计数 ， 直 到 遇 到 第 一 个 1， 所 以 在 
实现 的 时 候 就 从 最 高 位 开始 依次 判断 是 否 为 1， 如 果 为 1， 融 给 
出 当前 已 经 数 过 的 位 效 ， 如 果 没 有 为 1 的 位 ， 那 么 输出 32。 

clo 指 令 的 作用 是 从 最 高 位 开始 计数 ， 直 到 遇 到 第 一 个 0， 效 果 等 
同 于 先 将 操作 数 取 反 ， 然 后 从 最 高 位 开始 计数 ， 直 到 遇 到 第 一 
个 1， 所 以 在 实现 的 时 候 就 先 对 操作 数 取 反 ， 然 后 从 最 高 位 开始 
依次 判断 是 否 为 1， 如 果 为 1， 就 给 出 当前 已 经 数 过 的 位 数 ， 如 
果 没 有 为 1 的 位 ， 那 么 输出 32。 


(3) 第 三 段 代 码 进行 乘法 运算 。 对 于 有 符号 乘法 ， 要 先 求 补 码 ， 再 
相 乘 ， 最 后 进行 乘法 结果 的 修正 ， 乘 法 结果 保存 在 变量 mulres 中 。 


(4) 第 四 段 代 码 确 定 要 写 入 目的 寄存 器 的 情况 ， 有 以 下 两 点 说 明 。 


。 如 果 是 add、addi、sub、subi 指 令 ， 且 发 生 溢 出 ， 那 么 设置 
wre&_o 为 WriteDisable， 这 样 就 不 会 写 入 目的 寄存 器 。 

。 如 果 是 乘法 指令 以 外 的 简单 算术 操作 指令 ， 那 么 将 arithmeticres 
作为 要 写 入 目的 寄存 器 的 值 。 

。 如 果 是 乘法 指令 mul， 那 么 将 乘法 结果 的 低 32 位 作为 要 写 入 目的 
寄存 器 的 值 。 


(5) 第 五 段 代 码 确 定 对 HI、LO 寄 存 器 的 写 信息 。 如 果 是 乘法 指令 
mult、multu ， 那 么 需要 写 H、LO 寄 存 器 ， 所 以 设置 whilo_o 为 
WriteEnable， 写 入 HI 寄存 器 的 值 为 乘法 结果 的 高 32 位 ， 写 入 LO 寄存 器 的 
值 为 乘法 结果 的 低 32 位 。 


= 测试 简单 算术 操作 指令 实现 效 


本 节 通 过 实验 来 检验 我 们 修改 后 的 代码 是 否 实 现 了 简单 算术 操作 指 
令 ， 测 试 程序 如 下 ， 源 文件 是 本 书 附 带 光 盘 中 Code\Chapter7_1\AsmTest 
目录 下 的 inst_rom.S 文 件 。 


.org 0x0 
.Set noat 
.global _start 


_start: 


HHHHHHHHH E ER: 测试 add、addi、addiu、addu、sub、subu 指 令 


HHHHHHHHHHHHHHH 
ori $1,$0,0x8000 # $1 = 0x00008000 
sll $1,$1,16 # $1 = 0x80000000 
ori $1,$1,0x0010 # $1 = 0x80000010 ”给 $1 赋 初 值 
ori $2,$0,0x8000 # $2 = 0x00008000 
sll $2,$2,16 # $2 = 0x80000000 
ori $2,$2,0x0001 # $2 = 0x80000001 ”给 $2 赋 初 值 
ori $3,$0,0x0000 # $3 = 0x00000000 
addu $3,$2,$1 # $3 = 0x00000011 $1 加 $2， 无 符号 加 


ori $3,$0,0x0000 # $3 = 0x00000000 


ori $1,$0,0xffff 
sll $1,$1,16 


ori $1,$1,0xfffb # $1 = -5 给 $1 赋 初 值 
ori $2,$0,6 # $2 = 6 给 $2 赋 初 值 
mul $3,$1,$2 # $3 = -30 = Oxffffffe2 


# $1 乘 以 2， 有 符号 乘法 ， 结 果 的 低 32 位 保存 到 $3 


mult $1, $2 # HI = Oxffffffff 
# LO = 9xffffffe2 
# $1 乘 以 $2， 有 符号 乘法 ， 结 果 保 存 到 HI、 


LO 寄存 器 
multu $1,$2 # HI = 0x5 
# LO = Oxffffffe2 
# $1 乘 以 $2， 无 符号 乘法 ， 结 果 保 存 到 HI、 
LO 寄存 器 
nop 
nop 


程序 的 注释 给 出 了 预期 效果 ， 将 上 述 inst_rom.S 文 件 与 第 4 章 建 立 的 
Bin2Mem.exe, Makefile、ram.ld 这 三 个 文件 复制 到 Ubuntu 虚拟 机 中 的 同 
一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make all, EN 
可 得 到 用 于 ModelSim 仿 真 的 指令 存储 器 初始 化 文件 inst_rom.datao 


在 ModelSim 中 新 建 一 个 工程 ， 并 添加 本 书 附 带 光 盘 中 
Code\Chapter7 1 目录 下 的 所 有 .v 文 件 ， 然 后 可 以 编译 。 再 将 上 面 的 
inst_rom.data 文 件 复制 到 ModelSim 工 程 的 目录 下 ， 就 可 以 进行 仿真 了 。 仿 


真 结 果 如 图 7-6、 图 7-7、 图 7-8、 图 7-9 所 示 ， 分 别 对 应 测试 程序 中 的 四 


几 


» rst sto 
» ck Sti 
5-4 reafilet/regs[1] [0000 

5-4 reafile1/regs[2] f200... [80000001 
1-4 regfileljregs[3] |ffffsooc] {00000000 00000011 }00000000 80000010 如 000000f }00000011 }00000000 }Ffffsooo 


图 7-6 ”观察 寄存 器 $3 的 变化 ， 可 知 OpenMIPS 正 确实 现 了 add、addi、addiu、addu、sub、subu 指 
令 ， 对 应 测试 程序 第 一 段 


® rst sto 

dee dk Sti 
5-4 regfile1/regs[1] |000... 
EÒ regfileifregs[2] Jooo... [| DO 0000001)00000000 如 0000001 


图 7-7 观察 寄存 器 $2 的 变化 ， 可 知 OpenMIPS 正 确实 现 了 slt、sltu、slti、sltiu 指 令 ， 对 应 测试 程序 
第 二 段 


» rst 

© ck 
E$ regfile1/regs[1] 
3-4 regfile1/regs[2] 


® rst 

bd 
E$ regfile1/regs[1] 
1-4 reafile 1/regs[2] 


图 7-8 ”观察 寄存 器 $2 的 变化 ， 可 知 OpenMIPS 正 确实 现 了 clz、clo 指 令 ， 对 应 测试 程序 第 三 段 


O mul 指 令 的 结果 


® rst sto 

® dk me st a rd 
© reofilei/reas[1] | fffffffb [Door 
4 regfile1/fregs[2] |000... 
1-4 regfileifregs[3] [fez [FrFFa0OO jFfe2 
£4 hilo_reg0/hi_o 000... [00000000 CCCP Y00000005 
ES hilo_regOlo_o |ffffffe2fooo00000 2 


© HILO 模 块 的 输出 hi o， 即 HI 寄存 器 的 值 [一 一 
@ HILO 模 块 的 输出 lo o， 即 LO 寄存 器 的 值 


图 7-9 ”观察 寄存 器 $3、HI、LO 的 变化 ， 可 知 OpenMIPS 正 确实 现 了 mul、mnult、multu 指 令 ， 对 应 
测试 程序 第 四 段 


75 “流水线 暂停 机 制 的 设计 与 实现 
7.5.1 ”流水 线 暂停 机 制 的 设计 


因为 OpenMIPS 设 计 乘 累加 、 乘 累 减 、 除 法 指令 在 流水 线 执行 阶段 占 
用 多 个 时 钟 周期 ， 因 此 需要 暂停 流水 线 ， 以 等 待 这 些 多 周期 指令 执行 完 
毕 ， 一 种 直观 的 实现 方法 是 : 要 暂停 流水 线 ， 只 需 保 持 取 指令 地 址 PC 的 
值 不 变 ， 同 时 保持 流水 线 各 个 阶段 的 寄存 器 (也 就 是 IF/ID、ID/EX、 
EX/MEM、MEM/WB 模 块 的 输出 ) 不 变 。 


OpenMIPS 采 用 的 是 一 种 改进 的 方法 : 假如 位 于 流水 线 第 n 阶 段 的 指 
令 需要 多 个 时 钟 周期 ， 进 而 请 求 流 水 线 暂 停 ， 那 么 需 保持 取 指 令 地 址 PC 
的 值 不 变 ， 同 时 保持 流水 线 第 n 阶 段 、 第 n 阶 段 之 前 的 各 个 阶段 的 寄存 器 
不 变 ， 而 第 n 阶 段 后 面 的 指令 继续 运行 。 比 如 : 流水 线 执行 阶段 的 指令 请 
求 流水 线 暂 停 ， 那 么 保持 PC 不 变 ， 同 时 保持 取 指 、 译 码 、 执 行 阶段 的 寄 
存 器 不 变 ， 但 是 可 以 允许 访 存 、 回 写 阶段 的 指令 继续 运行 。 


为 此 ， 设 计 添 加 CTRL 模 块 ， 其 作用 是 接收 各 阶段 传递 过 来 的 流水 线 
暂停 请 求 信号 ， 从 而 控制 流水 线 各 阶段 的 运行 。 


为 了 实现 流水 线 暂 停机 制 ， 对 系统 结构 做 如 图 7-10 所 示 的 修改 。 


stall 


Tst 
stallreq_from_id 
stallreq_from_ex 
ctrlLV 
取 指 | 译 但 | PUT I 访 存 回 写 
PC IF/ID ID ID/EX EX EX/MEM MEM/WB 
stallreq stallreq 
> stall 
pc_reg.v 
z m> stall 
if_id. 11 m>] stall 
i ex_m wb.w 
stall 
id_ex.v ex.v 
id.v | 


87-10 ”为 了 实现 流水 线 暂 停机 制 而 对 系统 结构 所 做 的 修改 


CTRL 模 块 的 输入 来 自 ID、EX 模 块 的 请 求 暂停 信号 stallreq， 对 于 
OpenMIPS 教 学 版 而 言 ， 只 有 译 码 、 执 行 阶段 可 能 会 有 暂停 请 求 ， 取 指 、 
访 存 阶段 都 没有 暂停 请 求 ， 因 为 指令 读 取 、 数 据 存储 器 的 读 / 写 操作 都 可 
以 在 一 个 时 钟 周期 内 完成 。 


CTRL 模 块 对 暂停 请 求 信号 进行 判断 ， 然 后 输出 流水 线 暂 停 信 号 
stall。 从 图 7-10 中 可 知 ，stall 输 出 到 PC、IF/ID、ID/EX、EX/MEM、 
MEM/AWB 等 模块 ， 从 而 控制 PC 的 值 ， 以 及 流水 线 各 个 阶段 的 寄存 器 。 


7.5.2 ”流水 线 暂 停机 制 的 实现 


1. CTRL 模 块 的 实现 


CTRL 模 块 的 接口 如 图 7-10 所 示 ， 各 接口 的 作用 如 表 7-1 所 示 。 


表 7-1 CTRL 模块 的 接口 描述 


输 处 于 译 人 码 阶段 的 指令 是 否 请 求 流水 线 和 暂停 


stallreq from ex 处 于 执行 阶段 的 指令 是 否 请 求 流水 线 暂停 


读者 需要 注意 : 输出 信号 stall 是 一 个 宽度 为 6 的 信号 ， 其 含义 如 下 。 


stall[0] 表 示 取 指 地 址 PC 是 否 保持 不 变 ， 为 1 表示 保持 不 变 。 
stall[1] 表 示 流 水 线 取 指 阶段 是 否 暂停 ， 为 1 表示 暂停 。 


stall[2] 表 示 流 水 线 译 码 阶 段 是 否 暂 停 ， 为 1 表示 暂停 。 
stall[3] 表 示 流 水 线 执行 阶段 是 否 暂停 ， 为 1 表示 暂停 。 
stall[4] 表 示 流 水 线 访 存 阶 段 是 否 暂 停 ， 为 1 表示 暂停 。 
stall[5] 表 示 流 水 线 回 写 阶 段 是 否 暂 停 ， 为 1 表示 暂停 。 


CTRL 模 块 的 代码 如 下 ， 源 文件 是 本 书 附带 光盘 中 Code\Chapter7_2 目 
录 下 的 ctrl.v。 


module ctr1( 


); 


input wire rst, 


input wire stallreq from id, // 来 自 译 码 阶段 的 暂停 
input wire stallreg_from_ex, // 来 自 执 行 阶段 的 暂停 
output reg[5:0] stall 


always @ (*) begin 
if(rst == “RstEnable) begin 


end 


endmodule 


其 中 宏 定义 Stop 在 defines.v 中 定义 如 下 : 


‘define Stop 1'b1 // 流水 线 暂停 
“define NoStop 1'b0 // 流水 线 继续 
上 述 程序 可 以 从 以 下 三 点 理解 。 


(1) 当 处 于 流水 线 执行 阶段 的 指令 请 求 暂 停 时 (Bstallreq_from_ex 
等 于 Stop) ， 按 照 OpenMIPS 流 水 线 暂 停机 制 的 设计 ， 要 求 取 指 、 译 码 、 
执行 阶段 暂停 ， 而 访 存 、 回 写 阶段 继续 ， 所 以 设置 stall 为 6'b001111。 


(2) 当 处 于 流水 线 译 码 阶 段 的 指令 请 求 暂停 时 (Blistallreq_from_id 
等 于 Stop) ， 按 照 OpenMIPS 流 水 线 暂停 机 制 的 设计 ， 要 求 取 指 、 译 码 阶 
段 暂 停 ， 而 执行 、 访 存 、 回 写 阶段 继续 ， 所 以 设置 stall 为 6'%b000111。 


(3) 其 余 情 况 下 ， 设 置 stall 为 6b000000， 表 示 不 暂停 流水 线 。 


2. 修改 取 指 阶段 


(1) 修改 PC 模块 


从 图 7-10 中 可 知 ，PC 模 块 新 增加 了 一 个 输入 信号 stall， 其 值 就 是 
CTRL 模 块 的 接口 stall。 修 改 取 指 阶 段 PC 模 块 的 代码 如 下 ， 其 中 修改 的 代 
码 使 用 加 粗 、 和 斜体 标识 。 源 文件 是 本 书 附 带 光 盘 中 Code\Chapter7_2 目 录 
下 的 pc_reg.v 文 件 。 


(2) 修改 IF/ID 模 块 


参考 图 7-10，IF/ID 模 块 也 新 增 了 一 个 输入 信号 stall， 主 要 修改 如 下 ， 
修改 的 代码 使 用 加 粗 、 和 斜体 标 识 。 完 整 代码 参考 本 书 附带 光盘 中 
Code\Chapter7_2 目 录 下 的 if_id.v 文 件 。 


3。 修 改 译 码 阶段 


(1) 修改 ID 模块 


参考 图 7-10，ID 模 块 新 增 了 一 个 输出 信号 stallred， 在 实现 加 载 、 存 储 
指令 的 时 候 会 给 该 信号 赋值 ， 目 前 暂时 设置 这 个 输出 就 是 NoStop， 具 体 


代码 不 再 给 出 ， 读 者 可 以 参考 本 书 附带 光盘 中 Code\Chapter7_2 目 录 下 的 
id.v 文 件 。 


(2) 修改 ID/EX 模 块 


参考 图 7-10，ID/EX 模 块 新 增 了 一 个 输入 信号 stall， 主 要 修改 如 下 ， 
修改 的 代码 使 用 加 粗 、 笠 体 标 识 。 完 整 代码 位 于 本 书 附 带 光 盘 中 
Code\Chapter7_2 目 录 下 的 id_ex.v 文 件 。 


4. 修改 执行 阶段 


(1) 修改 EX 模块 


参考 图 7-10 ，EX 模 块 新 增 了 一 个 输出 信号 stallred_from_ex， 在 本 章 
后 面 实现 乘 累 加 、 乘 累 减 、 除 法 指令 的 时 候 会 给 该 信号 赋值 。 


(2) 修改 EX/MEM 模 块 


参考 图 7-10，EX/MEM 模 块 新 增 了 一 个 输入 信号 stall， 主 要 修改 如 
下 ， 修 改 的 代码 使 用 加 粗 、 和 斜体 标识 。 完 整 代 码 位 于 本 书 附带 光盘 中 
Code\Chapter7_2 目 录 下 的 ex_mem.v 文 件 。 


5。 修 改 访 存 阶段 


访 存 阶段 只 需要 修改 MEM/WB 模 块 ， 参 考 图 7-10，MEM/WB 模 块 也 
新 增 了 一 个 输入 信号 stall， 主 要 修改 如 下 ， 修 改 的 代码 使 用 加 粗 、 冬 体 标 


识 。 完 整 代 码 位 于 本 书 附带 光盘 中 Code\Chapter7_2 目 录 下 的 mem_wb.v 文 
件 。 


6. 修改 顶层 模块 OpenMIPS 


因为 上 面 添 加 了 CTRL 模 块 ， 而 且 对 流水 线 各 个 阶段 的 模块 也 都 增加 
了 相应 的 接口 ， 所 以 要 修改 OpenMIPS 模 块 ， 以 将 新 增 接口 与 CTRL 模 块 
连接 起 来 ， 连 接 关系 如 图 7-10 所 示 ， 具 体 的 代码 不 在 书 中 列 出 ， 读 者 可 以 
参考 本 书 附带 光盘 中 Code\Chapter7_2 目 录 下 的 openmips.v 文 件 。 


76 RAM. RAMSAR 


乘 累 加 、 乘 累 减 指令 共有 4 条 ， 包 括 : madd, maddu, msub, 
msubu， 各 指令 的 格式 如 图 7-11 所 示 。 从 图 中 可 知 ， 这 4 条 指令 的 指令 码 
都 是 SPECIAL2， 第 6 一 15bit 都 为 0， 可 以 依据 第 0 人 5bit 的 功能 码 确 定 是 哪 


一 种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 


poa ts rt 00000 | 00000 hans madd 指 令 
ad ae rt 00000 | 00000 oppor maddu 指 令 
ores ts rt 00000 | 00000 ae msub 指 令 
areca rt 00000 | 00000 r | msubu 指 令 


图 7-11 madd、maddu、msub、msubu 指 令 的 格式 


© 当 功 能 码 是 6b000000 时 ， 表 示 是 madd 指 令 ， 有 符号 乘 累 加 运 
算 。 


指令 用 法 为 : madd rs, rto 


指令 作用 为 : (HL LO} <- (HL LO} +rs x rt， 将 地 址 为 rs 的 通用 寄存 
器 的 值 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 有 符号 数 进行 乘法 运算 ， 运 算 结 
果 与 {HL LO} 相 加 ， 相 加 的 结果 保存 到 {HL LO} 中 。 此 处 {HI, LO} 表 示 
HI、LO 寄 存 器 连接 形成 的 64 位 数 ，HI 是 高 32 位 ，LO 是 低 32 位 。 


© 当 功 能 码 是 6b000001 时 ， 表 示 是 maddu 指 令 ， 无 符号 乘 累加 运 
算 。 


指令 用 法 为 : maddu rs, rto 


指令 作用 为 : (HL LO} <- (HL LO} +rs xrt， 将 地 址 为 rs 的 通用 寄存 
器 的 值 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 进 行 乘法 运算 ， 运 算 结 
果 与 {HL LO} 相 加 ， 相 加 的 结果 保存 到 {HI, LO} 中 。 


。 当 功 能 码 是 6b000100 时 ， 表 示 是 msub 指 令 ， 有 符号 乘 累 减 运 
算 。 


指令 用 法 为 : msub rs, rto 


指令 作用 为 : (HL LO} <- (HL LO) - rs x rt， 将 地 址 为 rs 的 通用 寄存 
器 的 值 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 有 符号 数 进 行 乘法 运算 。 然 后 使 
FA{HI, LO} 减 去 乘法 结果 ， 相 减 的 结果 保存 到 {HI, LO} 中 。 


。 当 功 能 码 是 6b000101 时 ， 表 示 是 msubu 指 令 ， 无 符号 乘 累 减 运 
=, 


指令 用 法 为 : msubu rs, rto 


指令 作用 为 : (HL LO} <- (HL LO) -rs x rt， 将 地 址 为 rs 的 通用 寄存 
器 的 值 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 进 行 乘法 运算 。 然 后 使 
用 {HI, LO} 减 去 乘法 结果 ， 相 减 的 结果 保存 到 {HI, LO} 中 。 


7.7 RAM, RAMESH SE 


在 本 章 开 始 已 经 说 明了 乘 累 加 、 乘 累 减 指令 的 实现 思路 ， 计 划 在 流 
水 线 执行 阶段 采用 两 个 时 钟 周 期 完成 运算 ， 第 一 个 时 钟 周期 进行 乘法 运 
算 ， 第 二 个 时 钟 周 期 将 乘法 结果 与 HI、LO 寄 存 器 进行 加 /减法 。 


为 了 实现 乘 累 加 、 乘 累 减 指令 的 实现 思路 ， 必 须要 保存 两 个 信息 : 
(1) 当前 是 第 几 个 时 钟 周 期 ; (2) 乘法 结果 。OpenMIPS 通过 在 
EX/MEM 模 块 中 添加 两 个 寄存 器 cnt、hilo， 分 别 保存 上 述 信息 。 修 改 系统 
结构 如 图 7-12 所 示 。 


执行 


ent 1 cnt_o 


hilo_temp 0 hilo 1 hilo o 


cnt 1 
hilo_temp_i 


图 7-12 ”为 实现 乘 累 加 、 乘 累 减 指令 而 对 系统 结构 做 的 修改 


执行 阶段 EX 模块 的 输出 hilo_temp_o 是 乘法 结果 ， 传 递 到 EX/MEM 模 
块 ， 并 在 下 一 个 时 钟 周 期 送 回 EX 模块 ， 参 与 第 二 个 时 钟 周期 的 加 /减法 运 
算 。 

执行 阶段 EX 模块 的 输出 cnt_o 代 表 当 前 是 第 几 个 时 钟 周 期 ， 传 递 到 
EX/MEM 模 块 ， 并 在 下 一 个 时 钟 周 期 送 回 EX 模块 ， 后 者 据 此 判断 当前 处 
TRAN, Fe RES ASL MATT ABA. 


7.8 ”修改 OpenMIPS 以 实现 乘 累 
加 、 乘 累 减 指令 


7.8.1 ”修改 译 码 阶段 的 ID 模 块 


译 码 阶段 的 ID 模块 要 添加 对 乘 累 加 、 乘 累 减 指令 的 分 析 ， 根 据 图 7- 
11 给 出 的 指令 格式 可 知 ， 这 4 条 指令 都 是 SPECIAL2 类 指令 ， 可 以 依据 功 
能 码 确 定 是 哪 一 种 指令 ， 确 定 指令 的 过 程 如 图 7-13 所 示 。 


= EXE_SPECIAL2_INST = EXE MADD 
op ) > op3 = > madd 指 令 
= EXE MADDU > 
nn = > maddu 指 令 
= EXE_MSUB J 
5 > msub 指 令 
wire[5:0] op = inst_i[3 1:26]; = EXE_MSUBU | BR 
wire[4:0] op2 = inst_i[10:6]; msubu 指 人 
wire[5:0] op3 = inst_i[5:0]; de e 
wire[4:0] op4 = inst_i[20:16]; 


图 7-13 ”确定 乘 累加 、 乘 累 减 指令 的 过 程 


其 中 涉及 的 宏 定义 如 下 ， 正 是 图 7-13 中 各 个 指令 的 功能 码 。 在 本 书 附 
带 光盘 中 Code\Chapter7_2 目 录 下 的 defines.v 文 件 中 可 以 找到 这 些 定 义 。 


HMM RNIDRRESEKARU ES, BARBAS BAR 
Code\Chapter7_2 目 录 下 的 id.v 文 件 。 


wreg_o <= "WriteDisable; 
aluop_o <= "EXE_MSUBU_OP; 
alusel_o <= ~EXE_RES_MUL; 
regi_read_o <= 1'b1; 
reg2_read_o <= 1'b1; 
instvalid <= "InstValid; 

end 

default: begin 

end 


endcase //EXE_SPECIAL_INST2 case 


endmodule 
这 4 条 指令 的 译 码 过 程 都 是 相似 的 ， 简 单 说 明 如 下 。 


(1) 因为 最 终结 果 都 是 写 入 HI、LO 寄 存 器 ， 而 不 是 写 入 通用 寄存 
器 ， 所 以 设置 wreg_o 为 WriteDisable。 


(2) 因为 都 要 读 取 两 个 寄存 器 的 值 ， 所 以 设置 regl_read_o、 
reg2_read_o 为 1b1。 默 认 通 过 Regfile 模 块 读 端 口 1 读 取 的 寄存 器 地 址 
reg1l1_addr_o 的 值 是 指令 的 第 21~25bit， 正 是 指令 中 的 rs; 默认 通过 Regfile 
模块 读 端 口 2 读 取 的 寄存 器 地 址 reg2_addr_o 的 值 是 指令 的 第 16~20bit， 正 
是 指令 中 的 rt; 所 以 最 终 译 码 阶 段 的 输出 reg1_o 就 是 地 址 为 rs 的 寄存 器 的 
值 ，reg2_o 就 是 地 址 为 rt 的 寄存 器 的 值 。 


(3) 运算 类 型 alusel_o 的 值 都 设置 为 EXE_RES_MUL ， 不 过 由 于 没有 
要 写 的 通用 寄存 器 ， 所 以 此 处 alusel o 的 值 并 没有 作用 ， 也 可 以 设置 为 


EXE_RES_NOPo 


(4) 运算 子 类 型 aluop_o 的 值 设置 为 与 具体 的 指令 对 应 。 


7.8.2 ”修改 执行 阶段 的 EX 模块 


参考 图 7-12 可 知 ，EX 模 块 要 增加 4 个 接口 ， 具 体 如 表 7-2 所 示 。 


表 7-2 ”EX 模块 增加 的 接口 描述 


2 


2 E 当前 处 于 执行 阶段 的 第 几 个 时 钟 周期 
第 一 个 执行 周期 得 到 的 乘法 结果 
下 一 个 时 钟 周期 处 于 执行 阶段 的 第 几 个 时 钟 周期 
EX 模块 的 代码 主要 修改 如 下 ， 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter7_2 目 录 下 的 ex.v 文 件 。 


module ex( 


// 增加 的 输入 接口 


input wire[ DoubleRegBus] hilo_temp_i, 


// 使 用 reg2 i 作为 乘 数 


assign opdata2_mult = (((aluop_i == “EXE MUL OP) | | 
(aluop_i == ~EXE_MULT_OP) || 
(aluop_i == ~EXE_MADD_OP) || 
(aluop_i == ~EXE_MSUB_OP) ) 


&& (reg2_i[31] == 1'b1)) ? 


(~reg2_i + 1) : reg2_i; 


// (3) 得 到 临时 乘法 结果 ， 保 存在 变量 hilo_temp 中 
assign hilo_temp = opdata1_mult * opdata2_mult; 


// (4) 对 临时 乘法 结果 进行 修正 ， 最 终 的 乘法 结果 保存 在 变量 mulres 中 ， 有 


两 种 情况 : 

// A. 如 果 是 有 符号 乘法 运算 madd、msub， 那 么 需要 修正 临时 乘法 结 
R WMF: 

// Al. 如 果 被 乘 数 与 乘 数 两 者 一 正 一 负 ， 那 么 需要 对 临时 乘法 结 

// hilo_temp 求 补 码 ， 作 为 最 终 的 乘法 结果 ， 赋 给 变量 

mulreso 

// A2. 如 果 被 乘 数 与 乘 数 同 号 ， 那 么 hilo_temp 的 值 就 作为 mulres 

// 的 值 。 

// B. 如 果 是 无 符号 乘法 运算 maddu、msubu， 那 么 hnilo_temp 的 值 就 作 
为 


// 最 终 的 乘法 结果 ， 赋 给 变量 mulLres 


always @ (*) begin 


begin 
whilo_o <= 'WriteEnable; 
hi_o <= hilo_temp1[63:32]; 
lo_o <= hilo _temp1[31:0]; 
end else if((aluop_i == ‘EXE MADD OP) || 


(aluop_i == ~EXE_MADDU_OP) ) 


begin 
whilo_o <= 'WriteEnable; 
hi_o <= hilo_temp1[63:32]; 
lo_o <= hilo _temp1[31:0]; 
endmodule 


上 述 代 码 可 以 分 为 四 段 理解 。 


(1) 第 一 段 : 计算 从 通用 寄存 器 中 读 出 的 两 个 寄存 器 的 乘法 结果 ， 
保存 在 mulres 中 。 


(2) 第 二 段 : 以 乘 累 加 指令 为 例 进行 讲解 。 乘 累 减 指令 与 此 类 似 。 


。 如 果 cnt_i 为 2b00， 表 示 是 乘 累加 指令 的 第 一 个 执行 周期 ， 此 时 
将 乘法 结果 mulres 通 过 接口 hilo_temp_o 输 出 到 EX/MEM 模 块 ， 以 
便 在 下 一 个 时 钟 周期 使 有 用。 同时， 设置 变量 
stallreq_for_ madd_msub 为 Stop ， 表 示 乘 累加 指令 请 求 流 水 线 暂 


停 。 


。 如 果 cnt_i 为 2b01， 表 示 是 乘 累加 指令 的 第 二 个 执行 周期 ， 此 时 
EX 模块 的 输入 hilo_temp_i 就 是 上 一 个 时 钟 周期 得 到 的 乘法 结 
果 ， 所 以 将 hilo_temp i 与 HI、LO 寄 存 器 的 值 相 加 ， 得 到 最 终 的 
运算 结果 ， 保 存 到 变量 hilo_templ 中 。 同 时 ， 设 置 变 量 
stallreq_for_madd_msub 为 NoStop， 表 示 乘 累加 指令 执行 结束 ， 
不 再 请 求 流水 线 暂 停 。 最 后 ， 设 置 cnt_o 为 2b10， 而 不 是 直接 设 
置 为 2b00， 目 的 是 : 如 果 因 其 他 原因 导致 流水 线 保持 暂停 ， 那 
么 由 于 cnt_o 为 2b10， 所 以 EX 阶段 不 再 计算 ， 从 而 防止 乘 累 加 指 
令 重 复 运 行 。 


(3) BER: 给 出 信号 stallreq 的 值 ， 目 前 只 有 乘 累 加 、 乘 累 减 指 令 
会 导致 流水 线 暂 停 ， 所 以 stallreq 就 直接 等 于 变量 stallreq_for_madd_msub 
的 值 。 


(4) SOR: 由 于 乘 累加 、 乘 累 减 指令 要 将 最 终结 果 写 入 HI、LO 


寄存 器 ， 所 以 在 第 四 段 给 出 了 对 HI、LO 寄 存 器 的 


783 ”修改 EX/MEM 模 块 


参考 图 7-12 可 知 ，EX/MEM 模 块 要 增加 4 个 接口 ， 具 体 如 表 7-3 所 示 。 


表 7-3” EX/MEM 模 块 增加 的 接口 描述 


接口 名 | 宽度 (bit) 输入 /输出 
hilo 输入 保存 的 乘法 结果 


a PO ox 下 一 个 时 钟 周期 是 执行 阶段 的 第 几 个 时 钟 周期 
nr 当前 处 于 执行 阶段 的 第 儿 个 时 钟 周期 
EX/MEM 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter7_2 目 录 下 的 ex_mem.v 文 件 。 


7.8.4 ”修改 OpenMIPS 模 块 


因为 上 面 为 EX、EX/MEM 模 块 添加 了 接口 ， 所 以 需要 修改 OpenMIPS 
模块 ， 以 将 这 些 接口 连接 起 来 ， 连 接 关系 如 图 7-12 所 示 ， 具 体 代 码 不 在 书 
中 列 出 ， 读 者 可 以 参考 本 书 附带 光盘 中 Code\Chapter7 2 目录 下 的 
openmips.v 文 件 。 


7.9 MARRIM, RRAK 
效果 


本 节 将 通过 一 个 测试 程序 验证 为 OpenMIPS 添 加 的 乘 办 加、 乘 累 减 指 
令 是 否 实现 正确 ， 测 试 程序 如 下 ， 源 文件 是 位 于 本 书 附带 光盘 中 
Code\Chapter7_2\AsmTest 目 录 下 的 inst_rom.S 文 件 。 


.Org 0x0 

.set noat 

.global _start 
_start: 

ori $1,$0,0xffff 

sll $1,$1,16 


ori $1,$1,0xfffb # $1 = -5 为 寄存 器 $1 赋 初 值 
ori $2,$0,6 #$2=6 为 寄存 器 $2 赋 初 值 
mult $1,$2 # hi = QOxffffffff 


# lo = Oxffffffe2 


madd $1, $2 # hi Oxt enn nnty 
# lo = 9xffffffc4 


maddu $1, $2 # hi = 0x5 
# lo = Oxffffffa6 


msub $1,$2 # hi = 0x5 
# lo = Oxffffffc4 


msubu $1, $2 # hi = oxfffrfrff 


# lo Oxf fffffe2 


连续 的 4 条 乘 累加 、 乘 累 减 指令 ， 程 序 的 注释 给 出 了 预期 执行 结果 。 
ModelSim 仿 真如 图 7-14 所 示 。 从 图 中 可 知 ， 乘 累加 、 乘 累 减 指令 实现 正 
确 ， 同 时 ， 可 以 观察 到 乘 累 加 、 乘 累 减 指令 都 需要 两 个 时 钟 周期 执行 完 


b 
EB, 


dee rst sto 

» dk sto AASS ee E ee [E a Le E PEA ee ed| 
6-4 hilo_reg0/hi_o | frrFrr [RTA J00000005 I 
63-46 hilo_regdfo_o |ffffffea] free 4 IfFFFFFa6 cA \iftffe2 


图 7-14 ” 乘 累 加 、 乘 累 减 指令 实现 效果 


7.10 ”除法 指令 说 明 


除法 指令 有 2 条 ， 包 括 : div、divu， 各 指令 的 格式 如 图 7-15 所 示 。 从 
图 中 可 知 这 2 条 指令 的 指令 码 都 是 SPECIAL ， 第 6-15bit 都 为 0， 可 以 依据 
第 0-5bit 的 功能 码 确定 是 哪 一 种 指令 。 


31 26 25 21 20 16 15 11 10 6 5 0 


SPECIAL DIV + te A 
000000 rs rt 00000 00000 011010 div 指 令 
SPECIAL DIVU CA 
000000 TS rt 00000 00000 011011 divu 指 令 


图 7-15 ”div、divu 指 令 的 格式 


。 当 功 能 码 是 6'b011010 时 ， 表 示 是 div 指 令 ， 有 符号 除法 运算 。 
指令 用 法 为 : div rs, rto 


指令 作用 为 : {HI, LO} <- rs / rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 ， 与 
地 址 为 rt 的 通用 寄存 器 的 值 ， 作 为 有 符号 数 进行 除法 运算 ， 将 商 保存 到 寄 
存 器 LO， 余 数 保存 到 寄存 器 HI。 


。 当 功 能 码 是 6'b011011 时 ， 表 示 是 divu 指 令 ， 无 符号 除法 运算 。 
指令 用 法 为 : divu rs, rto 


指令 作用 为 : {HI, LO} <- rs / rt， 将 地 址 为 rs 的 通用 寄存 器 的 值 ， 与 
地 址 为 rt 的 通用 寄存 器 的 值 ， 作 为 无 符号 数 进行 除法 运算 ， 将 商 保存 到 寄 
存 器 LO， 余 数 保存 到 寄存 器 HI。 


7.11 除法 指令 实现 思路 
7.11.1 HAA 


OpenMIPS 设 计 采 用 试 商法 实现 除法 运算 ， 对 于 32 位 的 除法 ， 至 少 需 
要 32 个 时 钟 周期 才能 得 到 除法 结果 。 本 节 介 绍 试 商法 的 一 般 过 程 。 


设 被 除数 是 m， 除 数 是 n， 商 保存 在 s 中 ， 被 除数 的 位 数 是 k， 其 计算 
步骤 如 下 (为 了 便于 说 明 ， 在 此 处 将 所 有 数据 的 最 低位 称 为 第 1 位 ， 而 不 
称 为 第 0 位 ) 。 


1. 取出 被 除数 的 最 高 位 m[k]， 使 用 被 除数 的 最 高 位 减 去 除数 "7， 如 
果 结 果 大 于 等 于 0， 则 商 的 s[k] 为 1， 反 之 为 0。 


2. 如 果 上 一 步 得 出 的 结果 是 0， 表 示 当 前 的 被 减 效 小 于 除 效 ， 则 取 
出 被 除数 剩 下 的 值 的 最 高 位 m[k-1]， 与 当前 被 碱 数组 合作 为 下 一 轮 的 被 减 
效 ; 如 果 上 一 步 得 出 的 结果 是 1， 表 示 当 前 的 被 减 数 大 于 除数 ， 则 利用 上 
一 步 中 减法 的 结果 与 被 除数 剩 下 的 值 的 最 高 位 m[k-1] 组 合作 为 下 一 轮 的 被 
减 数 。 然 后 ， 设 置 k 等 于 k-1。 


3. 新 的 被 减 数 减 去 除数 ， 如 果 结 果 大 于 等 于 0， 则 商 的 s[k] 为 1， 敬 
则 s[k] 为 0， 后 面 的 步骤 重复 2-3， 直 到 k 等 于 1。 
上 述 步骤 可 以 使 用 图 7-16 描 述 。 


7 
Ke 


ha N 
Whi) 
y 


置 m 为 被 除数 、n 为 除数 ，k 为 m 的 位 数 ，s 为 商 ， 将 s 清 零 


Y 
被 减 数 minuend 为 m[k]， 减 数 为 n 


la 
—————minuend=n GAT 等 了 0 一 
y | 
s[k]= s[k]=1 
— east] oo AR De R OO 
i an 
y 
minuend= (minuend, m[k-1]) minuend= (minuend-n, m[k-1]) 
y 
k=k-1 


图 7-16” 试 商法 的 运算 过 程 
以 4b1101 除 以 4b0010 为 例 ， 采 用 试 商 法 时 的 计算 步骤 如 表 7-4 所 示 。 


表 7-4 “使 用 试 商法 计算 1101/0010 (都 是 二 进 制 ) 


PEE m 为 1101， 除 数 n N 0010, 
Kk 为 4， 同时 s 清 零 


(1-0010) <0, s[4]=0 


UCA CS TE 
UCI AE ETT 
ane ja | | 1E 


最 终 得 到 商 为 0110 


7.11.2 ”实现 思路 


新 建 一 个 模块 DIV， 在 其 中 实现 采用 试 商法 的 32 位 除法 运算 。 当 流水 
线 执行 阶段 的 EX 模块 发 现 当 前 指令 是 除法 指令 时 ， 首 先 暂 停 流 水 线 ， 然 
后 将 被 除数 、 除 数 等 信息 送 到 DIV 模块 ， 开 始 除法 运算 。DIV 模 块 在 除法 
运算 结束 后 ， 通 知 EX 模 块 ， 并 将 除法 结果 送 到 EX 模块 ， 后 者 依据 除法 结 
果 设 置 HI、LO 寄 存 器 的 写 信 息 ， 同 时 取消 暂停 流水 线 。 


7.11.3 ”系统 结构 的 修改 


为 了 实现 7.11.2 节 的 思路 ， 修 改 系统 结构 如 图 7-17 所 示 。 


执行 
EX DIV 
annul i 
div_start_o }——> start 1 
div_opdata2_o+——3> opdata2_i 
div_opdata1_o}—— opdatal_i 
signed_div_o}—» signed div i result_o 
rst ready 0 
A div_result_i clk 
—> div_ready_i div. 
ex.v 


图 7-17 为 了 实现 除法 指令 而 对 系统 结果 做 的 修改 


EX 模块 通过 接口 div_opdatal_o、div_opdata2_o 分 别 给 出 被 除数 、 除 
数 ， 同 时 通过 接口 signed_div_o 指 明 是 否 是 有 符号 除法 ， 然 后 通过 接口 
div_start_o 指 示 开 始 除法 运算 。 


DIV 模块 在 除法 运行 完毕 后 ， 通 过 接口 ready_o 告 知 EX 模 块 ， 并 且 通 
过 接口 result_o 输 出 除法 结果 ，result_o 的 宽度 是 64 位 ， 其 中 高 32 位 是 余 
EN, 低 32 位 是 商 。 


7.12 ”修改 OpenMIPS 以 实现 除法 指 
> 


7.12.1 增加 DIV 模块 


DIV 模块 的 接口 如 图 7-17 所 示 ， 各 接口 的 含义 如 表 7-5 所 示 。 


表 7-5 ”DIV 模块 的 接口 描述 


signed div i 


opdata2_i 


复位 信号 ， 


是 否 有 符号 除法 ， 


高 电 平 有 效 


为 1 表示 有 符号 除法 


start_i 


annul i 


HAS 
是 否 


运算 


算 ， 为 1 表示 取消 除法 


result_o 


DIV 模块 的 主要 部 分 是 一 
如 图 7-18 所 示 。 


个 状态 机 ，# 


start_i == `DivStart and ar i= 


start_i == ‘DivStart and 
annul_i == 1'b0 and 
opdata2_i/=*ZeroWord 


i Ae 


annul_i == 1'b0 and cnt /= 32 


( DivFree 状 态 
ES 


A DivOn 状 态 


除法 运算 结果 


除法 运算 是 耕 结束 


共有 四 个 状态 ， 


如 下 ， 状 态 转换 


=! bo au Rn i == ZeroWord 
N yr el N i N 
de 4 ” DivByZero 状 态 ) 
\ N start_i == "DivStop | 
SS 
x 
A paa RK | 
y == 1'b1 Sn m. an 
2 DivEnd {KAS ) 
annul_i == 1'b0 and ent = 


图 7-18 DIV 模块 内 部 的 状态 转换 图 


除法 模块 
DivByZero: 除数 是 0。 
DivOn: 除法 运算 进 4 


DivFree: 


Alo 


J 中 。 


DivEnd: 除法 运算 结束 。 


复位 的 时 候 ，DIV 模 块 处 于 DivFree 状 态 ， 当 输入 信号 start i 为 


DivStart， 且 输入 信号 annul i 为 0 时 ， 表 示 除 法 操作 开始 。 


。 如 果 除 数 opdata2_ i 为 0， 那 么 进入 DivByZero 状 态 ， 直 接 给 出 除 
Cle A A 并 
通知 EX 模块 得 到 除法 运算 结果 ， 后 者 会 设置 DIV 模块 的 输入 信 

号 start_i 为 DivStop， 除 法 运算 结束 。 
。 2 ji 不 为 0， 那 么 进入 DivOn 状 态 ， 使 用 试 商 法 ， 
经 过 32 个 时 钟 周 期 ， 得 出 除法 结果 ， 然 后 进入 DivEnd 状 态 ， 并 
通知 EX 模块 得 到 除法 运算 结果 ， 后 者 会 设置 DIV 模块 的 输入 信 

号 start_i 为 DivStop， 除 法 运算 结束 。 


DIV 模 块 的 代码 如 下 ， 源 文件 是 本 书 附 带 光盘 Code\Chapter7_3 目 录 下 
的 div.vo 


module div( 


input wire clk, 


input wire rst, 


input wire signed_div_i, 
input wire[31:0] opdatal_i, 
input wire[31:0] opdata2_i, 
input wire start_i, 
input wire annul_i, 
output reg[63:0] result_o, 
output reg ready_o 


); 


wire[32:0] div_temp; 


"DivByZero: begin //DivByzerof& 


dividend <= { ZeroWord, Zeroword}; 
state <= ~DivEnd; 


end 


YE BIER STETS ERS Divon JÈ 态 


大 


块 直 


时 


16; 如 


dividend 


di 


// 分 三 种 情况 : 
// (1) 如 果 输 入 信号 annul i 为 1， 表 示 处 理 器 取消 除法 运算 ， 那 么 DIV 模 


// 接 回 到 DivFree 状 态 。 
// (2) 如 果 annu1_i 为 90， 且 cnt 不 为 32， 那 么 表示 试 商 法 还 没有 结束 ， 此 


// 如 果 减 法 结果 div_temp 为 负 ， 那 么 此 次 迭代 结果 是 0， 参考 图 7- 


// 果 碱 法 结果 div_temp 为 正 ， 那 么 此 次 迭代 结果 是 1， 参 考 图 7-16， 


// 的 最 低位 保存 每 次 的 迭代 结果 。 同 时 保持 Divon 状 态 ，cnt 加 1。 
// (3) 如 果 annul i 为 0，， 且 cnt 为 32， 那 么 表示 试 商法 结束 ， 如 果 是 有 符 


// 除法 ， 且 被 除数 、 除 数 一 正 一 负 ， 那 么 将 试 商法 的 结果 取 补 码 ， 得 到 


// 结果 ， 此 处 的 商 、 余 数 都 要 取 补 码 。 商 保存 在 dividend 的 低 32 位 ， 


// 保存 在 dividend 的 高 32 位 。 同 时 进入 DivEnd 状 态 。 


endmodule 


DIV 模块 中 涉及 的 宏 定 义 ， 在 defines .v 中 定义 ， 如 下 : 


“define DivFree 2'b00 
“define DivByZero 2'b01 
“define Divon 2'b10 
“define DivEnd 2'b11 
“define DivResultReady 1'b1 


“define DivResultNotReady 1'b0 
“define DivStart 1'b1 


“define DivStop 1'b0 


7.12.2 ”修改 译 码 阶段 的 ID 模块 


译 码 阶段 的 ID 模块 要 增加 对 除法 指令 的 分 析 ， 根 据 图 7-15 给 出 的 指 
令 格 式 可 知 ， 除 法 指令 都 是 SPECIAL 类 指令 ， 可 以 依据 功能 码 确定 是 哪 
一 种 指令 ， 确 定 指令 的 过 程 如 图 7-19 所 示 。 


— EXE_SPECIAL_INST = -EXE_DIV 
op > op2 op3 > div 指 今 
=EXE_DIVU 
~ > divu 指 令 
ee | | bl .o.... 


wire[5:0] op = inst_i[31:26]; wire[4:0] op2 = inst_i[10:6]; 
wire[5:0] op3 = inst_i[5:0];  wire[4:0] op4 = inst_i[20:16]; 


图 7-19 ”确定 除法 指令 的 过 程 


其 中 涉及 的 宏 定义 如 下 ， 正 是 图 7-15 中 各 个 指令 的 功能 码 。 在 本 书 附 
带 光盘 Code\Chapter7_3 目 录 下 的 defines.v 文 件 中 可 以 找到 这 些 定义 。 


修改 译 码 阶段 的 了 D 模 块 如 下 。 完 整 代码 位 于 本 书 附 带 光 盘 
Code\Chapter7_3 目 录 下 的 id.v 文 件 。 


这 2 条 除法 指令 的 译 码 过 程 都 是 相似 的 ， 简 要 说 明 如 下 。 


(1) 因为 最 终结 果 是 写 入 HI、LO 寡 存 器 ， 不 需要 写 通用 寄存 器 ， 
所 以 赋值 wreg_o 为 WriteDisable。 


(2) 因为 要 读 取 两 个 通用 寄存 器 的 值 ， 所 以 设置 regl_read_o、 
reg2_read_o 为 1b1， 读 取 的 是 图 7-15 中 地 址 为 rs、rt 的 寄存 器 的 值 。 


(3) alusel_o 的 值 保 持 为 默认 值 EXE_RES_NOP。 


(4) 设置 aluop_o 的 值 与 具体 指令 对 应 。 


7.12.3 ”修改 执行 阶段 的 EX 模块 


参考 图 7-17 可 知 ，EX 模 块 需要 增加 部 分 接口 ， 增 加 的 接口 如 表 7-6 所 
示 。 


Rs ”EX 模块 新 增 的 接口 描述 


i 
tr Ja | 
iv_opdata2_o | 32 

7 start. 1 

4 


div_ opdata2 3 
¡ 


div_result_i 


div ready i 1 输 除法 运算 是 否 结束 


EX 模块 的 代码 主要 修改 如 下 。 完 整 代码 位 于 本 书 附带 光盘 
Code\Chapter7_3 目 录 下 的 ex.v 文 件 。 


module ex( 


// 新 增 来 自 除法 模块 的 输入 


hi_o <= "ZeroWord; 

lo_o <= "ZeroWord; 

end else if((aluop i == “EXE DIV OP) || (aluop_i == 
“EXE_DIVU_0P) 


) begin 
whilo_o <= ‘WriteEnable; 
hi_o <= div_result_i[63:32]; 


lo_o <= div_result_i[31:0]; 


上 面 的 代码 可 以 分 为 三 段 理解 。 


(1) 第 一 段 : 如 果 是 div 指 令 ， 并 且 DIV 模 块 没有 声明 除法 结束 (Bl 
div_ready_¡i35FDivResultNotReady) ， 那 么 输出 被 除数 、 除 数 、 除 法 开 
始 信号 、 有 符号 除法 等 信息 到 DIV 模块 ， 设 置 div_start_o 为 DivStart， 以 指 
示 DIV 模 块 开 始 除法 运算 ; 同时， 设置 stallreq_for_div 为 Stop， 表 示 由 于 
除法 运算 请 求 流水 线 暂停 。 反 之 ， 如 果 DIV 模 块 声明 除法 结束 (BP 
div_ready_i 等 于 DivResultReady) ， 那 么 设置 div_start_o 为 DivStop ， 以 指 
示 DIV 模 块 停止 除法 运算 ; 同时 ， 设 置 stallreq_for_div 为 NoStop ， 表 示 不 
是 由 于 除法 运算 请 求 流水 线 暂停 。 


divu 指 令 的 执行 过 程 与 div 指 令 类 似 。 


(2) 第 二 段 : 给 出 暂停 流水 线 请 求 信号 stallreq 的 值 ， 目 前 已 实现 的 
乘 累 加 、 乘 累 减 、 除 法 指令 都 会 请 求 流 水 线 暂 停 ， 所 以 stallreq 等 于 
stallreq_for_madd_msub 与 stallreq_for_div 进 行 逻 辑 “ 或 ”运算 的 结果 。 


(3) BER: 由 于 除法 指令 要 将 最 终结 果 写 入 HI、LO 寄 存 器 ， 所 
RS Raa lo 其 中 div_result_ i 就 是 DIV 
模块 计算 出 来 的 除法 结果 ， 高 32 位 存储 的 是 余数 ， 低 32 位 存储 的 是 商 。 


7.12.4 ”修改 OpenMIPS 模 块 


因为 添加 了 DIV 模块 ， 并 且 修 改 了 EX 模块 的 接口 ， 所 以 要 修改 
OpenMIPS 顶 层 模 块 ， 以 将 这 些 新 增 模块 、 接 口 连接 起 来 ， 连 接 关 系 如 图 
7-17 所 示 。 完 整 代码 可 以 参考 本 书 附带 光盘 Code\Chapter7_3 目 录 下 的 
openmips.v 文 件 ， 书 中 只 给 出 DIV 模块 的 例 化 语句 ， 如 下 。 


div divo( 
.Clk(clk), 


Ses ELEStO 


.Signed_div_i(signed_div), 
.Opdata1_i(div_opdatal), 
.opdata2_i(div_opdata2), 
.start_i(div_start), 


.annul_i(1'b0), 


.result_o(div_result), 


. ready_o(div_ready) 


这 里 需要 说 明 一 点 ，DIV 模 块 的 输入 接口 annulL_i 在 目前 固定 为 0， 表 
示 不 会 有 取消 除法 指令 的 情况 发 生 ， 但 是 在 后 续 章 节 ， 当 我 们 实现 异常 
处 理 的 时 候 ， 会 重新 确定 DIV 模块 的 输入 接口 annul_i 的 值 。 


7.13 ”测试 除法 指令 实现 效果 


本 节 将 通过 一 个 测试 程序 验证 为 OpenMIPS 添 加 的 除法 指令 是 否 实现 
正确 ， 测 试 程序 如 下 ， 源 文件 是 本 书 附 带 光 盘 Code\Chapter7_3\AsmTest 
目录 下 的 inst_rom.S 文 件 。 


.Org 0x0 

.global _start 
Estant: 

ori $2,$0,0xffff 

sll $2,$2,16 


ori $2,$2,0xfff1 #982.= -i5 为 寡 存 器 $2 赋 初 值 
ori $3,$0,0x11 Ne ily 为 寄存 器 $3 赋 初 值 
div $zero,$2,$3 # hi = Oxfffffff1 

# lo = 0x0 
divu $zero, $2, $3 # hi = 0x00000003 


# lo = 0xofofofoe 


div $zero,$3,$2 a ML S 2 
# lo = Oxffffffff 


给 寄存 器 $2 赋 初 值 -15， 寄 存 器 $3 赋 初 值 17， 然 后 分 别 使 用 div、 
divu、div 指 令 进 行 运算 ， 结 果 保 存在 HI、LO 寡 存 器 ， 程 序 的 注释 给 出 了 
预期 执行 结果 。ModelSim 仿 真如 图 7-20 所 示 ， 从 中 可 知 OpenMIPS 正 确实 
现 了 除法 指令 ， 并 且 可 以 观察 到 ， 除 法 指令 需要 多 个 时 钟 周期 才能 完 
成 。 


® rst sto 

dy ck Stı III 
344. hilo_reg0/hi_o 000... FFL \00000003 Yoooo0002 
3-4 hilo_reg0/lo_o |ffffffff [00000000 profe EEE 


图 7-20 ”ModelSim 仿 真得 到 的 div、divu 指 令 实 现 效果 


7.14 ”数据 流 图 的 修改 


通过 本 章 的 工作 ， 我 们 的 OpenMIPS 处 理 器 可 以 执行 所 有 的 算术 操作 
指令 了 ， 此 时 的 数据 流 图 如 图 7-21 所 示 。 


D fe 
| X 


P 指令 > HI 
"8 存储 器 > ALU fF » | LO 
| a | | hh 
| 
SR 全 | 
| nn | 
clk | 
le 取 指 >< 详 码 > 执行 rei fF. 回 写 、 


图 7-21 增加 算术 操作 后 的 数据 流 图 


相 比 第 6 章 的 图 6-4， 主 要 变化 是 增加 了 一 个 选择 器 ， 用 来 确定 PC 的 
值 。PC 在 下 一 个 时 钟 周 期 的 值 可 以 是 PC+4， 也 可 以 保持 当前 的 值 不 变 ， 
后 者 对 应 的 就 是 流水 线 暂停 时 的 情况 。 


第 8 章 ”转移 指令 的 实现 


本 章 将 为 OpenMIPS 处 理 器 添加 转移 指令 ， 转 移 指令 包括 跳 转 、 分 
支 两 种 ， 区 别 在 于 前 者 是 绝对 转移 ， 后 者 是 相对 转移 ， 但 实现 方法 是 相 
似 的 。 转 移 指令 涉及 延迟 槽 ， 所 以 首先 在 8.1 节 介绍 延迟 槽 的 概念 ， 接 
着 在 8.2 节 对 MIPS32 指 令 集 架构 中 定义 的 所 有 转移 指令 的 格式 、 作 用 、 
用 法 进行 了 说 明 。 在 8.3 节 介绍 OpenMIPS 实 现 转移 指令 的 思路 ， 以 及 对 
数据 流 图 、 系 统 结构 的 修改 。8.4 节 通过 修改 代码 实现 转移 指令 ， 最 后 
通过 两 个 测试 程序 ， 验 证 转移 指令 是 否 实现 正确 。 


8.1 ER 


在 实现 转移 指令 之 前 ， 先 介绍 一 下 延迟 槽 的 概念 。 在 第 5 章 已 经 介 
绍 了 流水 线 中 存在 的 三 种 相关 : 数据 相关 、 结 构 相 关 、 控 制 相 关 。 其 中 
控制 相关 是 指 流水 线 中 的 转移 指令 或 者 其 他 需要 改写 PC 的 指令 造成 的 
相关 。 这 些 指 令 改 写 了 PC 的 值 ， 所 以 导致 后 面 已 经 进入 流水 线 的 几 条 
指令 无 效 ， 比 如 : 如 果 转 移 指令 在 流水 线 的 执行 阶段 进行 转移 条 件 判 
断 ， 在 发 生 转 移 时 ， 会 导致 当前 处 于 取 指 、 译 码 阶 段 的 指令 无 效 ， 需 要 
重新 取 指 。 如 图 8-1 所 示 。 
指令 jir$3 的 执行 会 使 得 | pe 
程序 跳 转 到 0x220 处 ， 而 jr $3 # 此 时 $3 为 0x220 KERA 
此 时 指令 ori $3,$3,0x8 处 ”一 ori $3,$3,0x8 行 顺序 
于 流水 线 的 译 码 阶段 ， / ori $3,$3,0x9 
ori $3,$3,0x9 处 于 流水 线 | 
的 取 指 阶段 ， 这 两 条 指 Ss .org 0x220 
令 将 变 得 无 效 ， 不 会 得 i or $4,$9,$0 


到 执行 er 


图 8-1 转移 指令 会 使 得 其 后 面 已 经 进入 流水 线 的 几 条 指令 无 效 


| jr$3 
2| or $4,$9,$0 


\ 


也 就 是 说 ， 在 流水 线 执行 阶段 进行 转移 判断 ， 并 且 转 移 发 生 ， 那 么 
会 有 2 条 无 效 指令 ， 导 致 浪费 了 两 个 时 钟 周 期 。 为 了 减少 损失 ， 规 定 转 
移 指令 后 面 的 指令 位 置 为 “延迟 槽 ”>， 延 迟 槽 中 的 指令 被 称 为 “延迟 指令 ” 

(也 可 称 之 为 “延迟 槽 指令 ”) 。 延 迟 指令 总 是 被 执行 ， 与 转移 发 生 与 否 
没有 关系 。 引 入 延迟 模 后 的 指令 执行 顺序 如 图 8-2 所 示 。OpenMIPS 处 理 
器 就 计划 使 用 延迟 槽 技术 。 


指令 jr $3 的 执行 会 使 得 jr$3 # 此 时 $3 为 0x220 | 实际 执 | er 


程序 跳 转 到 0x220 处 ， 而 一 ori $3,83,0x8 HER 行 顺 序 | jr $3 

此 时 指令 ori $3,$3,0x8 处 / ori $3,$3,0x9 N ori $3,$3,0x8 
于 译 码 阶段 ， 并 且 该 指 \ “| ot $4,$9,$0 
邻 是 延迟 指令 ， 所 以 将 NY .Org 0x220 sf tete. 


得 到 执行 A or $4,$9,10 
图 8-2 ”引入 延迟 槽 以 减少 转移 带 来 的 损失 


但 是 ， 即 使 引入 延迟 槽 ， 在 转移 发 生 时 仍然 会 导致 已 经 进入 取 指 阶 
段 的 指令 无 效 ， 也 就 是 说 ， 仍 浪费 一 个 时 钟 周 期 ， 要 解决 这 个 问题 ， 可 
以 在 译 码 阶段 进行 转移 判断 ， 这 样 就 可 以 避免 浪费 时 钟 周 期 。 
OpenMIPS 处 理 器 就 设计 为 在 译 码 阶段 进行 转移 判断 。 


8.2 ”转移 指令 说 明 


MIPS32 指 令 集 架 构 中 定义 的 转移 指令 共有 14 条 ， 可 分 为 如 下 两 


e 跳 转 指 令 : jr, jalra ja jalo 
。 分 支 指令 : b、bal、beq、bgez、bgezal、bgtz、blez、bltz、 
bltzal. bneo 


其 中 ， 跳 转 指 令 是 绝对 转移 ， 分 支 指令 是 相对 转移 。 本 节 分 别 介绍 


这 两 类 指令 。 
1. RIES 


跳 转 指令 的 格式 如 图 8-3 所 示 。 


31 26 25 21 20 16 15 11 10 6 5 0 

SPECIAL JR aos 
000000 rs 00000 00000 00000 001000 jr 指令 

en rs 00000 rd 00000 ae jalr 指 令 
J ac Een 
000010 instr_index j 指 令 
Ree j instr_index jal 指 令 


图 8-3 ” 跳 转 指令 的 格式 


从 图 8-3 可 知 ，j、jal 指 令 可 以 通过 指令 码 进 行 判 断 ，jr、jalr 指 令 瞧 
指令 码 为 SPECIAL ， 还 需要 依据 功能 码 进一步 判断 。 


。 当 指令 中 的 指令 码 为 SPECIAL ， 功 能 码 为 6b001000 时 ， 表 示 jr 


指令 。 
指令 用 法 为 : jrrs。 


指令 作用 为 : pc <- rs， 将 地 址 为 rs 的 通用 寄存 器 的 值 赋 给 寄存 器 
PC， 作 为 新 的 指令 地 址 。 


。 当 指 令 中 的 指令 码 为 SPECIAL， 功 能 码 为 6b001001 时 ， 表 示 


jalr 指 令 。 


指令 用 法 为 : jalrrs 或 者 jalr rd, rso 


指令 作用 为 : rd <- return_address, pc <- rs， 将 地 址 为 rs 的 通用 寄存 
器 的 值 赋 给 寄存 器 PC， 作 为 新 的 指令 地 址 ， 同 时 将 跳 转 措 令 后 面 第 2 条 
虽 念 的 地 址 作为 返回 地 址 保存 到 地 址 为 rd 的 通用 寄存 器 ， 如 果 没 有 在 指 
令 中 指明 rd， 那 么 默认 将 返回 地 址 保存 到 寄存 器 $31。 


。 当 指 令 中 的 指令 码 为 6b000010 时 ， 表 示 j 指 令 。 
指令 用 法 为 : j target. 


指令 作用 为 : pc <- (pc+4)[31,28] || target || “00;， 转 移 到 新 的 指令 地 

址 ， 其 中 新 指令 地 址 的 低 28 位 是 指令 中 的 target (也 就 是 图 8-3 中 的 

instr_index) 左 移 两 位 的 值 ， 新 指令 地 址 的 高 4 位 是 跳 转 指令 后 面 延 迟 槽 
虽 令 的 地 址 高 4 位 。 


。 当 指 令 中 的 指令 码 为 6b000011 时 ， 表 示 jal 指 令 。 
指令 用 法 为 : jal targeto 


指令 作用 为 : pc <- (pc+4)[31,28] || target || "00" ， 转 移 到 新 的 指令 地 
址 ， 新 指令 地 址 与 指令 j 相 同 ， 不 再 解释 。 但 是 ， 指 令 jal 还 要 将 跳 转 指 
令 后 面 第 2 条 指令 的 地 址 作为 返回 地 址 保存 到 寄存 器 $31。 


j、jal、jr、jalr 指 令 在 转移 之 前 都 要 先 执行 延迟 槽 指令 。 


2. 分 支 指令 


分 支 指令 的 格式 如 图 8-4 所 示 。 


31 26 25 21 20 16 15 11 10 6 5 
BEQ 

000100 rs rt offset 
BEQ 
000100 | 00000 00000 offset 
BGTZ 2 
000111 rs 00000 offset 
BLEZ 

000110 rs 00000 offset 
BNE | 
000101 rs rt offset 

REGIMM BLTZ f 
000001 is 00000 offset 
REGIMM BLTZAL l 
000001 ie 10000 offset 

REGIMM A BGEZ u 
000001 00001 ur 
REGIMM R BGEZAL FE 
000001 10001 

y 00000 Eoy afet 


从 图 8-4 可 知 ， 前 5 条 指令 beq、b、bgtz、blez、bne 可 以 直接 依据 指 
令 中 的 指令 码 进行 判断 ， 确 定 是 哪 一 条 指令 ， 而 后 5 条 指令 bltz、 
bltzal、bgez、bgezal、bal 的 指令 码 都 是 REGIMM， 这 是 一 个 宏 定 义 ， 
值 为 6b000001， 需 要 根据 指令 中 16-20bit 的 值 进一步 判断 ， 从 而 确定 是 


哪 一 条 指令 。 


图 8-4 ”分 支 指令 的 格式 


从 图 8-4 还 可 知 ， 所 有 分 支 指令 
果 发 生 转 移 ， 那 么 将 offset 左 移 2 位 ， 并 
指令 的 地 址 相 加 ， 加 法 的 结果 就 是 转移 目的 地 址 ， 从 该 地 址 取 指 令 。 


9 第 0 一 15bit 存 储 的 都 是 offset ， 如 
扩展 至 32 位 ， 然 后 与 延迟 模 


Da 


TS 


beqi > 


bgtz 指 令 


blez 指 令 


bne 指 令 


bltz 指 令 


bltzal 指 令 


bgez 指 令 


bgezal 指 令 


bal 指 令 


转移 目标 地 址 = (signed_extend)( offset || ‘00’ ) + (pc+4) 


。 当 指 令 中 的 指令 码 为 6b000100 时 ， 表 示 beq 指 令 。 


指令 用 法 为 : beq rs, rt, offseto 


指令 作用 为 : ifrs = rt then branch， 将 地 址 为 rs 的 通用 寄存 器 的 值 与 
地 址 为 rt 的 通用 寄存 器 的 值 进 行 比较 ， 如 果 相 等 ， 那 么 发 生 转 移 。 


。 当 指令 中 的 指令 码 为 6b000100， 且 16-25bit 为 0 时 ， 表 示 b 指 
AN 


Zo 
指令 用 法 为 : b offset. 


指令 作用 为 : 无 条 件 转移 ， 从 图 8-4 可 知 ，b 指 令 可 以 认为 是 beq 指 
令 的 特殊 情况 ， 当 beq 指 令 的 rs、rt 都 等 于 0 时 ， 即 为 b 指 令 ， 所 以 在 
OpenMIPS 实 现 的 时 候 不 需要 特意 实现 b 指 令 ， 只 需要 实现 beq 指 令 即 
可 。 


。 当 指 令 中 的 指令 码 为 6b000111 时 ， 表 示 bgtz 指 令 。 
指令 用 法 为 : bgtz rs, offset。 


指令 作用 为 : if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 零 ， 那 么 发 生 转 移 。 


。 当 指令 中 的 指令 码 为 6b000110 时 ， 表 示 blez 指 令 。 
指令 用 法 为 : blez rs, offset。 


指令 作用 为 : if rs < 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
小 于 等 于 零 ， 那 么 发 生 转 移 。 


。 当 指令 中 的 指令 码 为 6b000101 时 ， 表 示 bne 指 令 。 


指令 用 法 为 : bne rs, rt, offset. 


指令 作用 为 : if rs z rt then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
不 等 于 地 址 为 rt 的 通用 寄存 器 的 值 ， 那 么 发 生 转 移 。 


。 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16~~20bit 为 5'b00000 时 ， 
表示 bltz 指 令 。 


指令 用 法 为 : bltz rs, offset. 


指令 作用 为 : if rs < 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
小 于 0， 那 么 发 生 转 移 。 


。 当 指令 中 的 指令 码 为 REGIMM， 且 第 16~20bit 为 5b10000 时 ， 
表示 bltzal 指 令 。 


指令 用 法 为 : bltzal rs, offseto 


指令 作用 为 : if rs < 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
小 于 0， 那 么 发 生 转 移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 作为 返回 
地 址 ， 保 存 到 通用 寄存 器 $31。 

。 当 指令 中 的 指令 码 为 REGIMM， 且 第 16 人 20bit 为 5b00001 时 ， 
表示 bgez 指 令 。 


指令 用 法 为 : bgez rs, offseto 


指令 作用 为 : if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 等 于 0， 那 么 发 生 转 移 。 


。 当 指 令 中 的 指令 码 为 REGIMM， 且 第 16~~20bit 为 5'b10001 时 ， 
表示 bgezal 指 令 。 


指令 用 法 为 : bgezal rs, offseto 


指令 作用 为 : if rs > 0 then branch， 如 果 地 址 为 rs 的 通用 寄存 器 的 值 
大 于 等 于 0， 那 么 发 生 转 移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 作为 
返回 地 址 ， 保 存 到 通用 寄存 器 $31。 


。 当 指 令 中 的 指令 码 为 REGIMM， 且 第 21 一 25bit 为 0， 第 16~ 
20bit 为 5b10001 时 ， 表 示 bal 指 令 。 


指令 用 法 为 : bal offset. 


指令 作用 为 : 无 条 件 转移 ， 并 且 将 转移 指令 后 面 第 2 条 指令 的 地 址 
作为 返回 地 址 ， 保 存 到 通用 寄存 器 $31。 从 图 8-4 的 指令 格式 可 知 ，bal 
指令 是 bgezal 指 令 的 特殊 情况 ， 当 bgezal 指 令 的 rs 为 0 时 ， 就 是 bal 指 令 ， 
所 以 在 OpenMIPS 实 现时 ， 不 用 特意 考虑 bal 指 令 ， 只 要 实现 bgezal 指 令 
即 可 。 


综 上 ，b、bal 指 令 不 用 单独 实现 ， 需 要 OpenMIPS 实 现 的 分 支 指令 
只 有 8 条 。 所 有 的 分 支 指令 在 转移 到 目标 地 址 前 都 要 先 执行 延迟 模 中 的 


指令 。 


8.3 ”转移 指令 实现 思路 
8.3.1 ”实现 思路 


根据 8.1 节 的 论述 ， 为 了 尽量 减少 转移 指令 带 来 的 损失 ，OpenMIPS 


在 译 码 阶 段 进 行 转移 条 件 的 判断 ， 如 果 满足 转移 条 件 ， 那 么 修改 PC 为 
转移 目标 地 址 。 


8.3.2 ”数据 流 图 的 修改 


为 了 实现 转移 指令 ， 修 改 数据 流 图 如 图 8-5 所 示 。 


do N 
Ks au 
= U 
X 
p He AS e ag || > HI 
>! >| 指令 ñ LU L 
£ | 存储 器 [器 LA A ALU f > pp» LO 
| M | 
dj 上 uh d 
| Si IX r x| we | | 一 | 
Ly Bay HI 一 = | | 
| E nern. | 
clk | 
取 指 ae 译 码 执行 ve ME 回 写 


图 8-5 ”为 实现 转移 指令 而 修改 的 数据 流 图 


从 图 8-5 中 可 知 ， 在 译 码 阶段 多 了 转移 判断 的 步骤 ， 此 外 ，PC 的 取 
值 变 为 三 种 情况 。 


情况 一 : PC 等 于 PC+4。 这 属于 一 般 情况 ， 每 个 时 钟 周 期 PC 加 4， 


虽 向 下 一 条 指令 。 


情况 二 : PC 保持 不 变 。 当 流水 线 暂停 的 时 候 ， 就 会 发 生 这 种 情 
况 ， 参 考 第 7 章 中 流水 线 暂停 的 实现 。 


青 况 三 : PC 等 于 转移 判断 的 结果 。 如 果 是 转移 指令 ， 且 满足 转移 
条 件 ， 那 么 会 将 转移 目标 地 址 赋 给 PC。 


8.3.3 ”系统 结构 的 修改 


为 了 实现 转移 指令 ， 需 要 对 系统 结构 进行 修改 ， 增 加 部 分 模块 的 接 
口 ， 主 要 修改 如 图 8-6 所 示 。 


取 指 译 码 | 执行 


next_inst_in_delayslot_o ——» next_inst_in_delayslot_i 


图 8-6 为 实现 转移 指令 而 对 系统 结构 所 做 的 修改 
ALA BILE tA. 


(1) 如 果 处 于 译 码 阶段 的 指令 是 转移 指令 ， 并 且 满 足 转移 条 件 ， 
么 了 DD 模块 设置 转移 发 生 标 志 branch flag 0 为 Branch， 同 时 通过 
branch_target_address_o 接 口 给 出 转移 目的 地 址 ， 送 到 PC 模块 ， 后 者 气 
此 修改 取 指 地 址 。 


(2) 如 果 处 于 译 码 阶段 的 指令 是 转移 指令 ， 并 且 满 足 转移 条 件 ， 
N 表示 下 一 条 
目 令 是 延迟 槽 指令 ， 其 中 DeaySlot 是 一 个 安定 义 。 


next_inst_in_delayslot_ 0 信号 会 送 关 入 ID/EX 模 块 ， 并 在 下 一 个 时 钟 周 期 通 


过 ID/EX 模 块 的 is_in_delayslot_o 接 口 送 回 到 ID 模块 ，ID 模 块 可 以 据 此 判 
断 当 前 处 于 译 码 阶段 的 指令 是 否 是 延迟 槽 指令 。 


(3) 如 果 转 移 指令 需要 保存 返回 地 址 ， 那 么 ID 模块 还 要 计算 返回 


地 址 ， 并 通过 link_addr_o 接 口 输出 ， 该 值 最 终 会 传递 到 EX 模块 ， 作 为 
要 写 入 目的 寄存 器 的 值 。 


8.4 ”修改 OpenMIPS 以 实现 转移 指 
> 


8.4.1 ”修改 取 指 阶段 的 PC 模块 


由 图 8-6 可 知 ，PC 模 块 需要 增加 接口 ， 增 加 的 接口 如 表 8-1 所 示 。 


表 8-1 PC 模块 增加 的 接口 描述 


修改 取 指 阶段 的 PC 模块 如 下 ， 主 要 修改 一 点 : 如 果 branch_flag iv 
Branch， 那 么 设置 新 的 PC 值 为 branch_target_address_i。 完 整 代码 位 于 本 
书 附带 光盘 中 Code\Chapter8 目 录 下 的 pc_reg.v 文 件 中 。 


module pc_reg( 


input wire clk, 


input wire rst, 


8.4.2 ”修改 译 码 阶段 
1. 修改 ID 模块 


由 图 8-6 可 知 ，ID 模 块 需要 增加 一 些 接口 ， 增 加 的 接口 描述 如 表 8-2 
所 示 。 


表 8-2 ”ID 模块 新 增加 的 接口 描述 


AA A 


branch flag o antl 是 否 发 生 转 移 


branch target _ address o 


转移 到 的 目标 地 址 


A 
, delayál & 当前 处 于 译 公 阶段 的 指令 是 否 位 于 延 
is in delayslot_o J BET 


ge a POSEA BORA AN 
5 next inst in delayslot_o | 1 i EN 
延迟 模 


当前 处 于 译 码 阶段 的 指令 是 和 否 位 于 延 


在 ID 模块 要 增加 对 转移 指令 的 分 析 ， 根 据 图 8-3、 图 8-4 给 出 的 转移 
指令 格式 可 得 ， 确 定 转 移 指令 的 过 程 如 图 8-7 所 示 。 


EXE_SPECIAL_INST zü EXE_JR 
op > op2 > 0p3 > jr 指令 
=EXE_JALR = 
ja 指令 
=EXE J = 其 他 
j 指 令 = 其 他 上 本。 
=EXE_JAL =o 
一 一 一 一 一 > jal 指令 
=EXE_BEQ 
T beq 指 令 ...o.. 
=EXE BGTZ 
bgtz 指 令 
=EXE_BLEZ 
= blez 指 令 
=EXE_BNE > 
bne 指 令 
= EXE_REGIMM_INST =EXE BLTZ 
> op4 = > bltz 指 令 
=EXE_BLTZAL = 
|=» bltzal 指 令 
= 其 他 =EXE BGEZ 
zz weweee 一 > bgez 指 令 
=EXE BGEZAL 
一 一 一 一 一 > bgezal 指 令 


wire[5:0] op = inst_i[31:26]; wire[4:0] op2 = inst_i[10:6]; 
wire[5:0] op3 = inst_i[5:0];  wire[4:0] op4 = inst es 


图 8-7 确定 转移 指令 的 过 


其 中 涉及 的 宏 定义 如 下 ， 在 本 书 附带 光盘 中 Code\Chapter8 目 录 下 
的 defines.v 文 件 中 可 以 找到 这 些 定义 。 


修改 译 码 阶段 的 吓 模 块 如 下 。 完 整 代码 请 参考 本 书 附 带 光 盘 中 
Code\Chapter8 目 录 下 的 id.v 文 件 。 


end 


endcase 


// 输出 变量 is_in_delayslot_o 表 示 当 前 译 码 阶段 措 令 是 否 是 延迟 槽 指令 
always @ (*) begin 
if(rst == ‘RstEnable) begin 
is_in_delayslot_o <= "NotInDelaySlot; 
end else begin 
// BSF is_in_delayslot_i 


is_in_delayslot_o <= is_in_delayslot_i; 


end 


end 


endmodule 


对 其 中 几 个 典型 指令 的 译 码 过 程 解 释 如 下 。 
(1) jriBS 


。 jr 指 令 不 需要 保存 返回 地 址 ， 所 以 设置 wreg_o 为 WriteDisable， 
设置 返回 地 址 link addro 为 0 ，auopo 保 持 默 认 值 
EXE_NOP_OP ，alusel_o 保 持 默 认 值 EXE_RES_NOP。 

。 jr 指令 要 转移 eo 寄存 器 rs 的 值 ， 所 以 需要 设 
置 regl_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 1 读 取 寄 存 


器 ， 读 取 的 寄存 器 地 址 正 是 指令 中 的 rs， 所 以 最 终 译 码 阶段 的 
输出 regl_o 就 是 地 址 为 rs 的 寄存 器 的 值 。 

。 jr 指令 是 绝对 转移 ， 所 以 设置 branch_flag_o 为 Branch。 

。 设置 转移 目标 地 址 branch_target_address_0 为 regl1 o， 也 即 是 读 
取出 来 的 通用 寄存 器 rs 的 值 。 

。 下 一 条 指令 是 延迟 槽 指令 ， 所 以 设置 next_inst_in_delayslot_o 


为 InDelaySlot。 


j 指 令 与 r 类 似 ， 只 是 转移 目标 地 址 不 再 是 通用 寄存 器 的 值 ， 所 以 不 
需要 读 取 通用 寄存 器 ， 设 置 reg1_read_o0 为 0， 转 移 目标 地 址 如 下 。 


{pc_plus_4[31:28], inst_i[25:0], 2'b00) 
(2) jalr 指 令 


。 jalr 指 令 需 要 保存 返回 地 址 ， 所 以 设置 wreg_o 为 WriteEnable， 
设置 返回 地 址 link_addr_ o 为 当前 转移 指令 后 面 第 2 条 指令 的 地 
tr , BP pc plus 8. KA, W 2 i & aluselo 为 
EXE_RES_JUMP_BRANCH ， 设 置 要 写 的 目的 寄存 器 地 址 
wd_o 为 指令 的 第 11~15bit， 正 是 图 8-3 中 的 rd。 

jalr 指 令 要 转移 到 的 目标 地 址 是 通用 寄存 器 rs 的 值 ， 所 以 需要 
设置 regl_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 1 读 取 寡 存 
器 ， 读 取 的 寄存 器 地 址 正 是 指令 中 的 rs， 所 以 最 终 译 码 阶段 的 
输出 regl_o 就 是 地 址 为 rs 的 寄存 器 的 值 。 

jalr 指 令 是 绝对 转移 ， 所 以 设置 branch_flag_o 为 Branch。 

设置 转移 目的 地 址 branch_target_address_o 为 regl1 o， 也 即 是 读 
取出 来 的 通用 寄存 器 rs 的 值 。 


下 一 条 指令 是 延迟 槽 指令 ， 所 以 设置 next_inst_in_delayslot_o 


为 InDelaySlot。 


jal 指 令 与 jalr 类 似 ， 只 是 jal 指 令 将 返回 地 址 写 到 寄存 器 $31 中 ， 所 以 
wd_o 直 接 设 置 为 5bl1111， 另 外 ， 转 移 目标 地 址 不 再 是 通用 寄存 器 的 
值 ， 所 以 不 需要 读 取 通用 寄存 器 ， 设 置 regl_read_o 为 0， 转 移 目 标 地 址 


如 下 。 


{pc_plus_4[31:28], inst_i[25:0], 2'b00) 


(3) beq 指 令 


beq 指 令 不 需要 保存 返回 地 址 ， 所 以 设置 wreg o 为 
WriteDisable ， 设 置 返回 地 址 link_addr_ o 为 0 ，aluop_o 保 持 默 
认 值 EXE_NOP_OP ，alusel_o 保 持 默 认 值 EXE_RES_NOP。 
beq 指 令 是 条 件 转移 ， 转 移 的 条 件 是 两 个 通用 寄存 器 的 值 相 
等 ， 所 以 需要 读 取 两 个 通用 寄存 器 ， 设 置 regl read o, 
reg2_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 1、 读 端口 2 读 
取 寄 存 器 ， 读 取 的 寄存 器 地 址 分 别 为 指令 中 的 rs、rt。 所 以 最 
终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 
就 是 地 址 为 rt 的 寄存 器 的 值 。 

对 于 beq 指 令 ， 如 果 读 取 的 两 个 通用 寄存 器 的 值 相 等 (BD 
reg] oS Freg2_0) ， 那 么 转移 发 生 ， 设 置 branch_flag_o 为 
Branch ， 同 时 设置 转移 目的 地 址 branch_target_address_o 为 
pc_plus_4 + imm_sll2_signedext。 此 外 ， 下 一 条 指令 是 延迟 槽 


指令 ， 所 以 设置 next_inst_in_delayslot_o 为 mhDelaySlot。 


bne 指 令 与 beq 类 似 ， 只 是 转移 条 件 是 两 个 通用 寄存 器 的 值 不 相等 。 


(4) bgtz 指 令 


e bgtz 指令 不 需要 保存 返回 地 址 ， 所 以 设置 wreg o 为 
WriteDisable ， 设 置 返回 地 址 link_addr_ o 为 0 ，aluop_o 保 持 默 
认 值 EXE_NOP_OP，alusel_o 保 持 默 认 值 EXE_RES_NOP。 

。bgtz 指 令 是 条 件 转移 ， 转 移 的 条 件 是 地 址 为 rs 的 通用 寄存 器 的 
值 大 于 0， 所 以 需要 设置 regl_read_o 为 1， 表 示 通 过 Regfile 模 块 
的 读 端 口 1 读 取 寄 存 器 ， 读 取 的 寄存 器 地 址 正 是 指令 中 的 rs。 
所 以 最 终 译 码 阶段 的 输出 reg1_o 就 是 地 址 为 rs 的 寄存 器 的 值 。 

。 对 于 bgtz 指 令 ， 如 果 读 取 的 地 址 为 rs 的 通用 寄存 器 的 值 大 于 0 

( 即 regl o 大 于 0) ， 那 么 转移 发 生 ， 设 置 branch_flag 0% 
Branch, ， 同 时 设置 转移 目的 地 址 branch_target_ address_o 为 
pc_plus_4 + imm_sll2_signedext。 此 外 ， 下 一 条 指令 是 延迟 槽 
指令 ， 所 以 设置 next_inst_in_delayslot_o 为 mhDelaySlot。 


blez、bgez、bltz 指 令 与 bgtz 类 似 ， 只 是 转移 的 条 件 不 同 。 
(5) bgezal 指 令 


。bgezal 指令 需要 保存 返回 地 址 ， 所 以 设置 wreg oW 
WriteEnable ， 设 置 返 回 地 址 link_addr 0 为 pc_plus 8 ， 设 置 
alusel_0 为 EXE_RES_JUMP_BRANCH， 此 外 ， 要 将 返回 地 址 
保存 到 寄存 器 $31， 所 以 设置 wd_o 为 5'b11111。 
bgezal 指 令 是 条 件 转 移 ， 转 移 的 条 件 是 地 址 为 rs 的 通用 寄存 器 
的 值 大 于 等 于 0， 所 以 需要 设置 reg1_read_0 为 1， 表 示 通 过 
Regfile 模 块 的 读 端口 1 读 取 寄存 器 ， 读 取 的 寄存 器 地 址 正 是 指 
令 中 的 rs。 所 以 最 终 译 码 阶段 的 输出 reg1_o 就 是 地 址 为 rs 的 寄 
存 器 的 值 。 


。 对 于 bgezal 指 令 ， 如 果 读 取 的 地 址 为 rs 的 通用 寄存 器 的 值 大 于 
SFO 〈《 即 regl.o 大 于 等 于 0) ， 那 么 转移 发 生 ， 设 置 
branch_flag_o 为 Branch, 同时 设置 转移 目的 地 址 
branch_target_address_o%Jpc_plus_4 + imm_sll2_signedext. 此 
外 ， 和 下 一 条 指令 是 延迟 槽 指令 ， 所 以 设置 
next_inst_in_delayslot_o 为 InDelaySlot。 


bltzal 指 令 与 bgezal 类 似 ， 只 是 转移 条 件 是 地 址 为 rs 的 通用 寄存 器 的 
值 小 于 0。 


修改 ID/EX 模 块 


参考 图 8-6 可 知 ，ID/EX 模 块 需要 增加 一 些 接口 ， 增 加 的 接口 描述 如 
表 8-3 所 示 。 


表 8-3 ”ID/EX 模 块 新 增加 的 接口 描述 


当前 处 于 译 码 阶 段 的 指令 是 否 位 
id is in delayslot We 
HES A 
处 于 译 人 码 阶段 的 转移 指 
id link address 
返回 地 址 
N z a 下 一 条 进入 译 码 阶段 的 指令 是 否 位 
l i -延迟 村 
一 = a 
en iy 


当前 处 于 执行 阶段 


处 于 执行 阶段 的 转移 指令 要 保存 的 
返回 地 址 
当前 处 于 译 人 码 阶 段 的 指令 是 否 位 于 


is in_delayslot_o 


ID/EX 模 块 的 代码 主要 修改 如 下 ， 很 简单 ， 当 流水 线 译 码 阶段 没有 
被 暂停 时 ，ID/EX 模 块 在 时 钟 上 升 沿 将 新 增加 的 输入 传递 到 对 应 的 输 
出 。 完 整 代码 位 于 本 书 附带 光盘 Code\Chapter8 目 录 下 的 id_ex.v 文 件 中 。 


ex_link_address <= id_link_address; 
ex_is_in_delayslot <= id_is in delayslot; 


is in delayslot_o <= next_inst_in delayslot_i; 


8.4.3 ”修改 执行 阶段 的 EX 模块 


由 图 8-6 可 知 ，EX 模 块 需要 增加 一 些 接口 ， 增 加 的 接口 描述 如 表 8-4 
所 示 。 


表 8-4 ”EX 模块 新 增加 的 接口 描述 


see (bi) | imi 


is in delayslot 1 1 


i moo i | 
J jilli 
Rt 
m 处 于 执行 阶段 的 转移 指令 要 保存 的 返 
2 link_address i 32 输入 
回 地 址 


EX 模块 的 代码 主要 修改 如 下 ， 完 整 代码 请 参考 本 书 附带 光盘 中 
Code\Chapter8 目 录 下 的 ex.v 文 件 。 


endmodule 


40 R alusel oA EXE RES JUMP BRANCH， 那么 就 将 返回 地 址 
link_address_i 作 为 要 写 入 目的 寄存 器 的 值 赋 给 wdata_o。 


注意 一 点 ， 此 处 并 没有 利用 输入 的 信号 is_in_delayslot i， 该 信号 表 
示 当 前 处 于 执行 阶段 的 指令 是 否 是 延迟 槽 指令 ， 这 个 信号 会 在 异常 处 理 
过 程 中 使 用 到 ， 本 章 暂 时 不 需要 。 


8.4.4 ”修改 OpenMIPS 模 块 


为 有 一 些 模块 添加 了 接口 ， 所 以 需要 修改 顶层 模块 OpenMIPS， 
以 将 这 些 新 增加 的 接口 按照 图 8-6 所 示 的 关系 连接 起 来 。 具 体 修改 也 很 
简单 ， 不 在 书 中 列 出 ， 读 者 可 以 参考 本 书 附带 光盘 Code\Chapter8 目 录 
下 的 openmips.v 文 件 。 


8.5 ”测试 转移 指令 的 实现 效果 


本 节 将 通过 两 个 测试 程序 验证 转移 指令 是 否 实现 正确 ， 这 两 个 测试 
程序 分 别 验证 跳 转 指令 、 分 支 指令 。 


8.5.1 ”测试 跳 转 指令 


测试 代码 如 下 ， 源 文件 是 本 书 光盘 中 Code\Chapter8\AsmTest\Test1 
目录 下 的 inst_rom.S 文 件 。 


上 述 程序 验证 了 j、jal、jr、jalr 指 令 ， 程 序 的 注释 给 出 了 寄存 器 $1 
的 变化 情况 ， 注意 $1 的 变化 是 按照 注释 中 的 序号 顺序 进行 的 。 


ModelSim 仿 真 结果 如 图 8-8 所 示 ， 观 察 $1 的 变化 可 知 OpenMIPS 正 确实 
现 了 跳 转 指令 。 


由 于 jal 0x40 指 令 的 延迟 模 指 令 是 除法 指令 ， 所 以 $1 会 在 多 个 时 钟 周期 保持 为 0x3 | 


de rst sto 
© ck Sto Tir ESN LP ad 
&® regfileifregs[1] 000... {00000001 }00000002}00000003 


544 hilo_regd/hi_o 1000... 
&-% hilo_reg0/lo_o 000... 


de rst sto 

® dk sto 
54 reofilet/regs[1] 000... 
545 hilo_reg0/hi_o 000... 
4 hilo_reg0/lo_o  |000... 


J00000002 
00000000 J0000000e 


® rst sto 

® dk sti 
54 reofilei/regs[i] f000... 
544, hilo_reg0/hi_o 000... 
345 hilo_reg0/lo_o 000... 


图 8-8 ” 跳 转 指令 的 仿真 测试 结 


852 ”测试 分 支 指令 


测试 代码 如 下 ， 源 文件 是 本 书 光盘 中 Code\Chapter8\AsmTest\Test2 
目录 下 的 inst_rom.S 文 件 。 


.Org 0x0 
.Set noat 
.set noreorder 
.set nomacro 
.global _start 
_start: 


ori $3,$0,0x8000 


sll $3,16 # 设置 $3 = 0x80000000 


_loop: 
j _loop 


nop 


上 面 的 测试 程序 使 用 了 所 有 的 分 支 指令 ， 程 序 的 注释 给 出 了 寄存 器 
$1 的 变化 情况 以 及 指令 执行 顺序 ， 注 意 寄 存 器 $1 的 变化 是 按照 注释 中 的 
序号 顺序 进行 的 。ModelSim 仿 真 结 果 如 图 8-9 所 示 ， 观 察 $1 的 变化 可 知 
OpenMIPS 正 确实 现 了 分 支 指令 。 


由 于 bal s2 指 令 的 延迟 梢 指令 是 除法 指令 ， 所 以 $1 会 在 多 个 时 钟 周 期 保持 为 0x3 N 


de rst sto 

® dk sto 
54 reofilet/regs[1] 000... 
8-4 hilo_regofni_o  |000... 
544, hilo_reg0/lo_o 000... 


© regfilet/regs[1] 000... 
345 hio rego/hio 000... 
344 hilo_reg0/lo_o  |000... 


14 reafilei/regs[1] ]000... 
€3-4 hilo_reg0/hi_o 000... 
544 hilo_reg0lo_o (000... 


® rst sto 

® ck Sti 
5-4 regfilet/regs[1] 000... 
3-4 hilo_reg0/hi_o  |000... 
344 hilo_reg0flo_o 000... 


® rst sto 

® dk sti 
5-4 regfilet/regs[1] 000... 
4 hilo_regO/hi_o 000... 
4 hilo_regüfo_o 000... 


图 8-9 ”分 支 指令 的 仿真 测试 结 


FE ”加 载 存 储 指令 的 实现 


本 章 将 实现 MIPS32 指 令 集 架构 中 定义 的 加 载 存储 指令 ， 分 两 步 : 
首先 实现 除 1、sc 指 令 外 的 一 般 加 载 存 储 指令 ， 其 次 实现 比较 特殊 的 加 
载 存储 指令 11、scoe 


读者 可 以 将 本 章 内 容 分 为 五 个 部 分 理解 阅读 : (1) 9.1 至 9.3 节 介绍 
了 一 般 加 载 存储 指令 的 实现 ;，(2) 为 了 验证 加 载 存 储 指令 是 否 实现 正 
确 ， 在 9.4 节 修改 了 我 们 之 前 一 直 用 来 做 测试 的 SOPC， 为 其 添加 了 数据 
RAM; (3) 9.5 节 给 出 了 针对 一 般 加 载 存储 指令 的 测试 程序 ， 通 过 
ModelSim 仿 真 验证 指令 是 否 实现 正确 ; (4) 9.6 至 9.9 节 介绍 了 特殊 加 
载 存 储 指令 11、sc 的 实现 ; (3) 9.10 至 9.12 节 探讨 了 由 于 加 载 指令 引起 
的 load 相 关 问 题 ， 给 出 了 OpenMIPS 的 解决 方法 ， 最 后 验证 了 解决 效 
果 。 


9.1 加载 存储 指令 说 明 


MIPS32 指 令 集 架 构 中 定义 的 加 载 存 储 指令 共有 14 条 ， 如 下 。 


。 8 条 加 载 指 令 : lb, lbu, lh, lhu, Iù Iw, lwh, lwro 


e 6 条 存储 指令 : sb、sc、sh、sw、swl、swro 


对 11、sc 指 令 的 说 明 将 放 在 9.6 节 ， 本 节 介 绍 其 余 的 12 条 指令 ， 在 本 
书 中 也 称 为 一 般 加 载 存储 指令 。 其 中 ， 由 于 lwl、lwr、swl、swl 这 4 条 指 
令 的 作用 不 太 容易 理解 ， 所 以 在 9.1.4、9.1.5 节 专题 介绍 。 


9.1.1 MEHESID, lbu, Ih, lhu, lw 
说 明 


加 载 指 令 ]b、1lbu、lh、1lhu、1lw 的 格式 如 图 9-1 所 示 。 


31 26 25 21 20 16 15 0 


LB 


100000 | base rt offset ib 指令 
ae base rt offset ibu 指 令 
l 00001 > rt offset 了 h 指 令 

ono base rt offset Ihu 指 令 
1 al 1 hase rt offset lw 指令 


图 9-1 ”加 载 指 令 ib、lbu、lh、lhu、]Iw 的 格式 


从 图 9-1 可 知 ， 这 5 条 加 载 指 令 可 以 根据 指令 中 26-31bit 的 指令 码 加 
以 区 人 分， 另外， 加载 指令 的 第 0 人 15bit 是 offset、 第 21 人 15bit 是 base， 加 
载 地 址 的 计算 方法 如 下 ， 先 将 16 位 的 offset 符 号 扩展 至 32 位 ， 然 后 与 地 
址 为 base 的 通用 寄存 器 的 值 相 加 ， 即 可 得 到 加 载 地 址 。 


加 载 地 址 = signed_extended(offset) + GPR[base] 
下 面 分 别 介绍 各 个 加 载 指令 的 作用 。 
。 当 指令 中 的 指令 码 为 6b100000 时 ， 是 Iib 指 令 ， 字 节 加 载 指 令 。 
指令 用 法 为 : lb rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 节 ， 然 后 符 
号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 


。 当 指 令 中 的 指令 码 为 6b100100 时 ， 是 lbu 指 令 ， 无 符号 字 节 加 


载 指令 。 
指令 用 法 为 : lbu rt, offset(base)。 


虽 令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 节 ， 然 后 无 
符号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 


。 当 指令 中 的 指令 码 为 6b100001 时 ， 是 jh 指令 ， 半 字 加 载 指令 。 
指令 用 法 为 : lh rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 半 字 ， 然 后 符 
号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 要 
求 ， 要 求 加 载 地 址 的 最 低位 为 0。 


。 当 指 令 中 的 指令 码 为 6b100101 时 ， 是 lhu 指 令 ， 无 符号 半 字 加 


载 指令 。 
指令 用 法 为 : lhu rt, offset(base)。 


虽 令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 半 字 ， 然 后 无 
符号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 
要 求 ， 要 求 加 载 地 址 的 最 低位 为 0。 


。 当 指 令 中 的 指令 码 为 6b100011 时 ， 是 lw 指令 ， 字 加 载 指令 。 
指令 用 法 为 : lw rt, offset(base)。 


虽 令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 ， 保 存 到 地 
址 为 rt 的 通用 寄存 器 中 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 加 载 地 址 的 最 低 


两 位 为 00。 


9.1.2 存储 指令 sb、sh、sw 说 明 


存储 指令 sb、sh、sw 的 格式 如 图 9-2 所 示 。 


31 26 25 21 20 16 15 0 
SB 


bA 

101000 base rt offset sb 指令 
SH 
101001 base rt offset sh 指令 
SW 
101011 base rt offset sw 指令 


图 9-2 存储 指令 的 格式 


从 图 9-2 可 知 ， 这 3 条 存储 指令 可 以 根据 指令 中 26~31bit 的 指令 码 加 
以 区 分 ， 另 外 ， 存 储 指令 的 第 0 人 15bit 是 offset、 第 21 人 15bit 是 base， 存 
储 地 址 的 计算 方法 如 下 ， 先 将 16 位 的 offset 符 号 扩展 至 32 位 ， 然 后 与 地 
址 为 base 的 通用 寄存 器 的 值 相 加 ， 即 可 得 到 存储 地 址 。 


存储 地 址 = signed_extended(offset) + GPR[base] 
下 面 分 别 介绍 各 个 存储 指令 的 作用 。 


。 当 指 令 中 的 指令 码 为 6b101000 时 ， 是 sb 指令 ， 字 节 存 储 指 
人 
指令 用 法 为 : sb rt, offset(base)。 


指令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 最 低 字 节 存储 到 内 存 中 的 
虽 定 地 址 。 


。 当 指 令 中 的 指令 码 为 6b101001 时 ， 是 sh 指令 ， 半 字 存 储 指 


a 
Xo 
指令 用 法 为 : sh rt, offset(base)。 


指令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 最 低 两 个 字 节 存储 到 内 存 
中 的 指定 地 址 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 计 算出 来 的 存储 地 址 的 最 
低位 为 0。 


。 当 指令 中 的 指令 码 为 6b101011 时 ， 是 sw 指令 ， 字 存储 指令 。 
指令 用 法 为 : sw tt, offset(base)o 


指令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 值 存储 到 内 存 中 的 指定 地 
址 。 该 指令 有 地 址 对 齐 要 求 ， 要 求 计 算出 来 的 存储 地 址 的 最 低 两 位 为 
00. 


9.13 ”加 载 存储 指令 用 法 示例 


OpenMIPS 处 理 器 是 按照 字 节 寻 址 ， 并 且 是 大 端 模式 ， 在 这 种 模式 
下 ， 数 据 的 高 位 保存 在 存储 器 的 低地 址 中 ， 而 数据 的 低位 保存 在 存储 器 
的 高 地 址 中 。 比 如 : 使 用 指令 sb 在 0x50 处 存储 0x81， 存 储 器 中 实际 存储 
效果 如 图 9-3 所 示 。 


地 址 0x50 0x51 0x52 0x53 


图 9-3 ”使 用 指令 sb 在 0x50 处 存储 0x81 


使 用 指令 sh 在 0x54 处 存储 0x8281， 存 储 器 中 实际 存储 效果 如 图 9-4 
所 示 。 


地 址 0x54 0x55 0x56 0x57 


数据 0x82 0x81 0 0 


图 9-4 ”使 用 指令 sh 在 0x54 处 存储 0x8281 


使 用 指令 sw 在 0x58 处 存储 0x84838281， 存 储 器 中 实际 存储 效果 如 
图 9-5 所 示 。 


地 址 0x58 0x59 OxSa 0x5b 


图 9-5 “使 用 指令 sw 在 0x58 处 存储 0x84838281 


此 时 使 用 加 载 指令 会 有 如 下 效果 。 


(1) 使 用 指令 ]bu 从 0x58 处 加 载 一 个 字 节 ， 读 出 的 字 节 就 是 0x84， 
经 无 符号 扩展 至 32 位 是 0x00000084。 


(2) 使 用 指令 ib 从 0x58 处 加 载 一 个 字 节 ， 读 出 的 字 节 就 是 0x84， 
经 符号 扩展 至 32 位 是 Oxffffff84。 


(3) 使 用 指令 lhu 从 0x58 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8483， 经 无 符号 扩展 至 32 位 是 0x00008483。 


(4) 使 用 指令 由 从 0x58 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8483， 经 符号 扩展 至 32 位 是 0xffff8483。 


(5) 使 用 指令 ih 从 0x59 处 加 载 一 个 半 字 ， 不 满足 地 址 对 齐 要 求 ， 


(6) 使 用 指令 lhu 从 0x5a 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8281， 经 无 符号 扩展 至 32 位 是 0x00008281。 


(7) 使 用 指令 了 h 从 0x5a 处 加 载 一 个 半 字 ， 读 出 的 半 字 就 是 
0x8281， 经 符号 扩展 至 32 位 是 0xffff8281。 


(8) 使 用 指令 lw 从 0x58 处 加 载 一 个 字 ， 读 出 的 字 就 是 
0x84838281。 


9.1.4 ”加 载 指令 Iwl、Iwr 说 明 


加 载 指 令 lwl、]wr 的 格式 如 图 9-6 所 示 。 


31 26 25 21 20 16 15 0 


‘on 0 base rt offset Iwl 指 令 
LWR a 
10110 | Pase rt offset Iwr 指 令 


图 9-6 “加载 指 令 Iwl、lwr 的 格式 


当 指 令 中 的 指令 码 为 6b100010 时 ， 是 lwl 指 令 ， 非 对 齐 加 载 指 
令 ， 向 左 加 载 。 


指令 用 法 为 : lwl rt, offset(base)。 


指令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 加 载 一 个 字 的 最 高 有 
效 部 分 。1wl 指 令 对 加 载 地 址 没有 要 求 ， 从 而 允许 地 址 非 对 齐 加 载 ， 这 
是 与 前 面 介 绍 的 h、lhu、1lw 指 令 的 不 同 之 处 。 在 大 端 模式 、 小 端 模式 


下 ，lw] 指 令 的 效果 不 同 ， 因 为 OpenMIPS 是 大 端 模式 ， 所 以 此 处 只 介绍 
在 大 端 模 式 下 lwl 指 令 的 效果 。 假 设计 算出 来 的 加 载 地 址 是 loadaddr， 
loadaddr 的 最 低 两 位 的 值 为 n， 将 loadaddr 最 低 两 位 设 为 0 后 的 值 称 为 
loadaddr align， 如 下 。 


加 载 地 址 loadaddr = signed_extended(offset) + GPR[base] 
n = loadaddr[1:0] 
loadaddr_align = loadaddr — n 


例如 : 假设 计算 出 来 的 加 载 地 址 是 s，lwl 指 令 要 从 地 址 5 加 载 数 
据 ， 那 么 loadaddr 就 等 于 5，n 等 于 1，loadaddr_ align 等 于 4。 


lw] 指 令 的 作用 是 从 地 址 为 loadaddr_align 处 加 载 一 个 字 ， 也 就 是 4 个 
字 节 ， 然 后 将 这 个 字 的 最 低 4-n 个 字 节 保存 到 地 址 为 rt 的 通用 寄存 器 的 高 
位 ， 并 且 保 持 低 位 不 变 。 


继续 上 例 ， 此 时 loadaddr_align 为 4， 所 以 从 地 址 4 处 加 载 一 个 字 ， 对 
应 的 是 地 址 为 4、5、6、7 的 字 节 ， 因 为 n 等 于 1， 所 以 将 加 载 到 的 字 的 最 
低 3 个 字 节 保存 到 地 址 rt 的 通用 寄存 器 的 高 3 个 字 节 。 如 图 9-7 所 示 。 一 个 
更 加 通用 的 描述 如 图 9-8 所 示 。 


地 址 0 1 2 3 lA 5 6 7 | 8 9 10 1 


数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |xl0 |xll 


执行 指令 前 的 $1 e| figh 


执行 完 指 令 后 的 $1 x5 | x6 |x7 | h Iwl $1,5($0) 


图 9-7 lw] 指 令 作用 举例 


执行 完 Iwl 指 令 后 ， 
目标 寄存 器 的 值 n 
地 址 loadaddr align 对 应 的 字 | IT | J | K | L ieee ° 
O + ee 
目标 寄存 器 的 初始 值 | e | f | g | nh E |: > FREE 
it f g h 3 


图 9-8 lw] 指 令 执行 效果 说 明 


。 当 指令 中 的 指令 码 为 6b100110 时 ， 是 lwr 指 令 ， 非 对 齐 加 载 指 
令 ， 向 右 加 载 。 


指令 用 法 为 : lwr rt, offset(base)o 


各 令 作 用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 加 载 一 个 字 的 最 低 有 效 
部 分 。 还 是 假设 计算 出 来 的 加 载 地 址 是 loadaddr，loadaddr 的 最 低 两 位 的 
值 为 nD， 将 loadaddr 最 低 两 位 设 为 0 后 的 值 称 为 loadaddr_align， 如 下 。 


加 载 地 址 loadaddr = signed_extended(offset) + GPR[base] 
n = loadaddr[1:0] 
loadaddr_align = loadaddr — n 


例如 : 假设 计算 出 来 的 加 载 地 址 是 9，lwr 指 令 要 从 地 址 9 加 载 数 
据 ， 那 么 loadaddr 就 等 于 9，n 等 于 1，loadaddr_align 等 于 8。 


lwr 指 令 的 作用 是 从 地 址 为 loadaddr_align 处 加 载 一 个 字 ， 也 就 是 4 个 
字 节 ， 然 后 将 这 个 字 的 最 高 n+1 个 字 节 保存 到 地 址 为 rt 的 通用 寄存 器 的 
低位 ， 并 且 保 持 高 位 不 变 。 


继续 上 例 ， 此 时 loadaddr_align 为 8， 所 以 从 地 址 8 处 加 载 一 个 字 ， 对 
应 的 是 地 址 为 8、9、10、11 的 字 节 ， 因 为 n 等 于 1， 所 以 将 加 载 到 的 字 的 
最 高 2 个 字 节 保存 到 地 址 rt 的 通用 寄存 器 的 低 2 个 字 节 。 如 图 9-9 所 示 。 一 
个 更 加 通用 的 描述 如 图 9-10 所 示 。 


地 址 0 1 2 3 | 4 x E 7 | 8 9 10 11 


数据 | x0 | xl | x2 | x3 


x4 | x5 | x6 | x7 


x8 | x9 | x10 | xil 


执行 指令 前 的 $1 elfigláh 


执行 完 指 令 后 的 $1 e f | x$ 


x9 Iwr $1,9($0) 


图 9-9 lwr 指 令 作用 举例 


执行 完 lwr 指 令 后 ， 
目标 寄存 器 的 值 
e f g I 0 
不 同 的 n， 执 行 完 
£ a 1 ar Do 
E lwr 指 令 后 的 目标 寄 
ram, i || || aR 2 ” 存 器 的 值 也 不 同 


地 址 loadaddr align 对 应 的 字 


= 
A 
E 


目标 寄存 器 的 初始 值 


oO 
i 
va 


I J K L 3 


图 9-10 lwr 指 令 执 行 效 果 说 明 


lwl 与 1lwr 指 令 配 合 可 以 实现 从 一 个 非 对 齐 地 址 加 载 一 个 字 ， 而且 只 
需要 使 用 2 条 指令 ， 提 高 了 效率 。 例 如 : 使 用 一 般 指 令 从 地 址 7 处 加 载 一 
个 字 ， 那 么 可 以 使 用 以 下 代码 实现 ， 共 5 条 指令 。 


lw $1, 4($0) # 取得 地 址 9x4 处 的 字 ， 保 存在 $1 中 
lw $2, 8($0) # 取得 地 址 9x8 处 的 字 ， 保 存在 $2 中 
sll $1, $1, 24 # $1 左 移 24 位 
slr $2, $2, 8 + $26 72810 


or $1, $1, $2 # $1 与 $2 进 行 逻 辑 7 或 "运算 ， 得 到 最 终结 果 


而 有 了 1lwl、1lwr 指 令 后 ， 只 需要 2 条 指令 即 可 。 如 下 ， 图 9-11 是 对 这 
个 过 程 的 描述 。 


wh 0 1 2 3/4 5 6 7/8 9 10 1 


数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |x10|x11 
| 
执行 指令 前 的 $1 e f g h 
执行 完 lwr 指 令 后 的 $1 x7 | x8 | x9 | x10 Iwr $1,10($0) 


图 9-11 组 合 使 用 指令 Iwl、lwr， 可 以 加 载 非 对 齐 地 址 的 字 


lwl $1, 7($0) 
lwr $1,10($0) 


915 ”存储 指令 swl、swr 说 明 


存储 指令 swl、swr 的 格式 如 图 9-12 所 示 。 


31 26 25 21 20 16 15 0 
SWL Be 
101010 base rt offset Swl 指 令 
SWR LA 
101110 base rt offset swriH 4 


图 9-12 ”存储 指令 swl、swr 的 格式 


。 当 指令 中 的 指令 码 为 6b101010 时 ， 是 swl 指 令 ， 非 对 齐 存 储 指 
令 ， 向 左 存储 。 


指令 用 法 为 : swl rt, offset(base)o 


指令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 高 位 部 分 存储 到 内 存 中 
指定 的 地 址 处 ， 存 储 地 址 的 最 后 两 位 确定 了 要 存储 rt 通用 寄存 器 的 哪 几 
个 字 节 。swl 指 令 对 存储 地 址 没有 对 齐 要 求 ， 这 是 与 前 面 介 绍 的 sh、sw 
虽 令 的 不 同 之 处 。 在 大 端 模 式 、 小 端 模 式 下 ，swl 指 令 的 效果 不 同 ， 
为 OpenMIPS 是 大 端 模式 ， 所 以 此 处 只 介绍 在 大 端 模式 下 swl 指 令 的 效 
果 。 假 设计 算出 来 的 存储 地 址 是 storeaddr，storeaddr 最 低 两 位 的 值 为 n， 
storeaddr 最 低 两 位 设 为 0 后 的 值 称 为 storeaddr_align， 如 下 。 


存储 地 址 storeaddr = signed_extended(offset) + GPR[base] 
n = storeaddr[1:0] 


storeaddr_align = storeaddr — n 


例如 : 假设 计算 出 来 的 存储 地 址 是 5，swl 指 令 要 向 地 址 5 存储 数 
据 ， 那 么 storeaddr 就 等 于 5，n 等 于 1，storeaddr_align 等 于 4。 


swl 指 令 的 作用 是 将 地 址 为 rt 的 通用 寄存 器 的 最 高 4-n 个 字 节 存储 到 
地 址 storeaddr 处 。 


继续 上 例 ， 此 时 storeaddr_align 为 4，n 为 1， 所 以 将 地 址 rt 的 通用 寄 
存 器 的 最 高 3 个 字 节 存储 到 从 地 址 5 开始 处 ， 对 应 的 是 地 址 为 5、6、 789 
三 个 字 节 ， 如 图 9-13 所 示 。 一 个 更 加 通用 的 描述 如 图 9-14 所 示 。 


通用 寄存 器 $1 的 值 F EJE E 


执行 swl 指 令 之 前 的 内 存 


地 址 0 1 2 3/4 5 6 7/8 9w 1 


数据 | x0 | xl | x2 | x3 | x4 | x5 x8 | x9 | x10] xll 


执行 swl 指 令 之 后 的 内 存 ia 


地 址 0 1 2 3]4 5 6 718 9 10 141 


数据 | xO | xl | x2 | x3 | x4 | e f | g | x8 | x9 | x10 | x11 


图 9-13 sw] 指令 作用 举例 


执行 完 swl 指 令 后 ， 内 存 地 
址 storeaddr align 对 应 内 容 N 


oon 1 ilki A Plex 0 : 
i 不 同 的 n， 执 行 完 
ec | |e 1 sw] 指令 后 的 内 存 地 
址 storeaddr_align 处 
IIe E] 2 存储 的 值 也 不 同 


I J K e 3 


地 址 为 rt 的 通用 寄存 器 的 值 


© 

m 
Wie] 

>p 


&19-14 ”swl 指 令 执行 效果 说 明 


。 当 指令 中 的 指令 码 为 6b101110 时 ， 是 swr 指 令 ， 非 对 齐 存 储 指 
令 ， 向 右 存储 。 


指令 用 法 为 : swr rt, offset(base)。 


指令 作用 为 : 将 地 址 为 rt 的 通用 寄存 器 的 低位 部 分 存储 到 内 存 中 
指定 的 地 址 处 ， 存 储 地 址 的 最 后 两 位 确定 了 要 存储 rt 通用 寄存 器 的 哪 几 
个 字 节 。 还 是 假设 计算 出 来 的 存储 地 址 是 storeaddr，storeaddr 的 最 低 两 
位 的 值 为 n，storeaddr 最 低 两 位 设 为 0 后 的 值 称 为 storeaddr_align， 如 下 。 


存储 地 址 storeaddr = signed_extended(offset) + GPR[base] 
n = storeaddr[1:0] 


storeaddr_align = storeaddr — n 


例如 : 假设 计算 出 来 的 存储 地 址 是 9，swr 指 令 要 向 地 址 9 存储 数 
据 ， 那 么 storeaddr 就 等 于 9，n 等 于 1，storeaddr_align 等 于 8。 


swr 指 令 的 作用 是 将 地 址 为 rt 的 通用 寄存 器 的 最 低 n+1 个 字 节 存储 到 
地 址 storeaddr_align 处 。 


继续 上 例 ， 此 时 storeaddr_align 为 8，n 为 1， 所 以 将 地 址 rt 的 通用 寄 
存 器 的 最 低 2 个 字 节 存储 到 从 地 址 8 开始 处 ， 对 应 的 是 地 址 为 8、9 的 两 个 
位 置 ， 如 图 9-15 所 示 。 一 个 更 加 通用 的 描述 如 图 9-16 所 示 。 


通用 寄存 器 $1 的 值 e De: O 


执行 swr 指 令 之 前 的 内 存 


地 址 0 1 2 3 4 5 6 7 | 8 9 10 ll 


数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 


x8 x9 | x10 | xll 


swr $1,9($0) 
执行 swr 指 令 之 后 的 内 存 
地 址 0 1 2 3 | 4 5 6 7 8 9 10 1 
数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 iu h |x10 | x11 
| 


图 9-15 ”swr 指 令 作用 举例 


执行 完 swr 指 令 后 ， 内 存 地 


内 存 地 址 storeaddr_align 对 ILIJI KIL his) KIL 0 
应 的 字 不 同 的 n， 执 行 完 
NK | L 1 swr 指 令 后 的 内 存 地 
址 storeaddr_align 处 
地 址 为 rt 的 通用 寄存 器 的 值 [|e | f | ge | h FL | 2 存储 的 值 也 不 同 
6 fi g h 3 


图 9-16 ”swr 指 令 执 行 效 果 说 明 


swl 与 swr 指 令 配 合 可 以 实现 向 一 个 非 对 齐 地 址 存储 一 个 字 ， 而 且 只 
须 使 用 2 条 指令 ， 提 高 了 效率 。 例 如 : 使 用 一 般 指令 向 地 址 7 处 存储 一 个 
字 ， 那 么 可 以 使 用 以 下 代码 实现 ， 共 5 条 指令 。 


sll $2, $1, 24 # 要 存储 的 数据 在 $1 中 ， 将 $1 的 最 高 字 节 存 储 到 $2 
sb $2, 7($0) # 存储 最 高 字 节 到 地 址 为 7 的 内 存 处 

sll $2, $1, 8 # 将 $1 的 第 2、1 字 节 保 存 到 $2 中 

sh $2, 8($0) # 存储 第 2、1 字 节 到 地 址 为 8、9 的 内 存 处 

sb $1, 10($0) # 存储 第 0 字 节 到 地 址 为 10 的 内 存 处 


而 有 了 swl、 swr 指 令 后 ， 只 需要 2 条 指令 即 可 。 如 下 ， 图 9-17 是 对 
这 个 过 程 的 描述 。 


通用 寄存 器 $1 的 什 Per: | E | h 


执行 swr 指 令 之 前 的 内 存 


地 址 0 1 2 3 4 5 6 7 8 9 10 1 


数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |xl0 | xli 


eee ee ee es | swl $1,7($0) 
执行 swl 指 令 之 后 的 内 存 


地 址 0 ] 2 3 4 5 6 7 8 9 10 11 


数据 | x0 | xl | x2 | x3 | x4 | x5 | x6 e x8 | x9 | x10 | xll 


swr $1,10($0) 


执行 swr 指 令 之 后 的 内 存 Y 
地 址 0 1 2 3|.4 5 6 7 | 


8 
数据 | xO | xl | x2 | x3 | x4 | x5 | x6 Fe | A 11 


图 9-17 组 合 使 用 指令 swl、swr， 可 以 向 非 对 齐 地 址 存储 字 


swl $1, 7($0) 
swr $1, 10($0) 


9.2 “加载 存储 指令 实现 思路 


本 节 介 绍 除 1、sc 之 外 的 加 载 存 储 指令 的 实现 思路 ，11、sc 指 仿 
现 思 路 将 在 9.7 节 专题 介绍 。 


1. 加 载 指令 实现 思路 


加 载 指 令 在 译 码 阶段 进行 译 码 ， 得 到 运算 类 型 alusel o、aluop_o， 
以 及 要 写 的 目的 寄存 器 信息 。 这 些 信 息 传 递 到 执行 阶段 ， 然 后 又 传递 到 
访 存 阶段 ， 访 存 阶 段 依据 这 些 信息 ， 设 置 对 数据 存储 器 RAM 的 访问 信 
号 。 从 RAM 读 取 回 来 的 数据 需要 按照 加 载 指 令 的 类 型 、 加 载 地 址 进行 
对 齐 调整 ， 调 整 后 的 结果 作为 最 终 要 写 入 目的 寄存 器 的 数据 。 


2. 存储 指令 实现 思路 


存储 指令 在 译 码 阶段 进行 译 码 ， 得 到 运算 类 型 alusel o、aluop_o， 
以 及 要 存储 的 数据 。 这 些 信息 传递 到 执行 阶段 ， 然 后 又 传递 到 访 存 阶 
段 ， 访 存 阶段 依据 这 些 信 息 ， 设 置 对 数据 存储 器 RAM 的 访问 信号 ， 将 
数据 瑟 入 RAM。 


需要 特别 注意 的 是 : 本 章 假设 可 以 在 一 个 时 钟 周期 内 完成 对 外 部 数 
据 存储 器 RAM 的 读 、 写 操作 ， 在 后 续 章节 实现 实践 版 OpenMIPS 处 理 
器 的 时 候 会 考虑 复杂 情况 。 


9.2.1 ”数据 流 图 的 修改 


为 了 实现 除 1、sc 之 外 的 加 载 存 储 指令 ， 修 改 数据 流 图 如 图 9-18 所 
示 。 主 要 是 在 访 存 阶段 增加 了 对 数据 存储 器 RAM 的 访问 ， 同 时 ， 由 于 
要 写 入 目的 寄存 器 的 数据 可 能 是 执行 阶段 的 结果 ， 也 可 能 是 在 访 存 阶段 
从 数据 存储 器 RAM 加 载 得 到 的 数据 ， 所 以 在 访 存 阶段 增加 了 一 个 多 路 
选择 器 ， 进 行 选择 。 


ann o > 
> > 
| Ju 
X 
KA 
P 指令 m! > Hi h 
8 . 存储 器 > ALU Pi U > LO 
+ ee | > 数据 = | 
we 存储 器 
sc 4 2 | 
clk 
le 取 指 se 译 码 Ja 执行 jk 访 存 回 写 、 


图 9-18 为 了 实现 除 1、sc 之 外 的 加 载 存 储 指令 而 修改 的 数据 流 图 


9.2.2 ”系统 结构 的 修改 


为 了 实现 除 1、sc 之 外 的 加 载 存 储 指令 ， 需 要 对 系统 结构 进行 修 
改 ， 增 加 部 分 模块 的 接口 ， 修 改 后 的 系统 结构 如 图 9-19 所 示 。 


OpenMIPS 
译 码 执行 | 访 存 
ID ID/EX EX EX/MEM MEM 
inst_O >j id inst ex_inst | inst i 
aluop_o p ex_aluop mem aluop }—~> aluop_i mem addr_o 
mem addr_o >| ex mem addr mem_mem_addr|—p mem addr i mem we_o 
mem sel o 
reg2_o HP ex_reg2 mem reg2 | reg2 1 mem data_o 
e mem ce o 
mem data 1 
id_ex.v ex_mem.v mem.v 
id.v 


数据 存储 器 RAM 


图 9-19 ”为 了 实现 除 1、sc 之 外 的 加 载 存 储 指令 而 对 系统 结构 的 修改 


主要 修改 内 容 如 下 。 


(1) 译 码 阶段 的 ID 模块 增加 了 输出 信号 insto， 其 值 就 是 处 于 译 码 
阶段 的 指令 ， 该 信号 会 传递 到 执行 阶段 ， 在 执行 阶段 的 EX 模块 会 利用 
该 信号 的 值 计算 加 载 、 存 储 地 址 mem_addr_o。 


(2) 执行 阶段 的 EX 模块 将 运算 子 类 型 aauop o、 加 载 存储 地 址 
mem_addr_ o、 读 取 的 第 二 个 操作 数 reg2_o 等 信息 ， 通 过 EX/MEM 模 块 
传递 到 访 存 阶 段 的 MEM 模 块 。 


(3) 访 存 阶 段 的 MEM 模 块 依据 加 载 、 存 储 指令 的 类 型 ， 确 定 对 数 
据 存储 器 RAM 的 访问 信息 ， 通 过 mem_ce_o 接 口 送 出 数据 存储 器 使 能 信 
3, mem_addr o 接 口 送 出 访问 地 址 ，mem_we_o 接 口 指出 是 加 载 还 是 存 
储 操 作 、mem_sel_o 接 口 送出 字 节 选择 信号 ， 如 果 是 存储 指令 ， 那 么 还 
通过 mem_data_o 接 口 输出 要 存储 的 数据 ， 如 果 是 加 载 指令 ， 那 么 会 从 
mem_data_i 接 口 获得 读 取 到 的 数据 ， 然 后 MEM 模 块 依据 具体 的 加 载 指 
令 类 型 、 加 载 地 址 ， 对 获取 的 数据 进行 对 齐 调整 ， 最 终 得 到 要 写 入 目的 
寄存 器 的 数据 。 


9.3 ”修改 OpenMIPS 以 实现 加 载 存 
储 指令 


9.3.1 ”修改 译 码 阶段 
1. 修改 ID 模 块 


参考 图 9-19 可 知 ，ID 模 块 要 增加 接口 insto， 如 表 9-1 所 示 。 


1 ID 模块 新 增加 的 接口 描述 


在 ID 模块 还 要 增加 对 加 载 存 储 指 令 的 分 析 ， 根 据 图 9-1、 图 9-2、 
9-6、 图 9-12 给 出 的 加 载 存 储 指 令 的 格式 可 知 ， 这 些 指令 的 指令 码 都 是 
不 同 的 ， 所 以 可 以 直接 依据 指令 码 确 定 是 哪 一 种 指令 ， 确 定 指令 的 过 程 
如 图 9-20 所 示 。 


=EXE LB - 
op >» lb 指令 
=EXE LBU 


> bu 指令 


=EXE LH = 
> 1h 指令 


=EXE LHU 


> lhu 指 令 wire[5:0] op = inst_i[31:26]; 


=EXE LW 
= > lw 指令 


=EXE LWL = 
> 1wl 指 令 


=EXE LWR = 
= > wii > 


=EXE SB 5 
= >» sb 指令 


=EXE SH 


>» shite 


=EXE SW 


> Sw 指 令 


=EXE SWL 


>» swl 指 今 


=EXE SWR 


> swr 折 令 


= 其 他 


...... 


图 9-20 ”确定 加 载 存 储 指令 的 过 程 


其 中 涉及 的 宏 定义 如 下 ， 正 是 各 个 加 载 存储 指令 的 指令 码 ， 在 本 书 
附带 光盘 Code\Chapter9_1 目 录 下 的 defines.v 文 件 可 以 找到 这 些 定义 。 


修改 译 码 阶段 的 人 D 模 块 如 下 。 完 整 代码 请 参考 本 书 附带 光盘 中 


Code\Chapter9_1 目 录 下 的 id.v 文 件 。 


aluop_o <= "EXE_SWL_OP; 
regi_read_o <= 1'b1; 
reg2_read_o <= 1'b1; 
instvalid <= "InstValid; 


alusel_o <= "EXE_RES_LOAD_STORE; 


end 

“EXE SWR: begin // sw S 
wreg_o <= `WriteDisable; 
aluop_o <= `EXE_SWR_OP; 


regi_read_o <= 1'b1; 
reg2_read_o <= 1'b1; 
instvalid <= "InstValid; 


alusel_o <= "EXE_RES_LOAD_STORE; 


译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 和 要 执行 
的 运算 三 个 方面 。 以 下 对 几 个 有 代表 性 的 指令 的 译 码 过 程 进行 说 明 。 


(1) lb 指令 


。 要 写 的 目的 寄存 器 : 加 载 指令 lb 需 要 将 加 载 结果 写 入 目的 寄存 
器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 参考 图 9-1 可 知 ， 要 
写 的 目的 寄存 器 地 址 是 指令 中 的 第 16 人 20bit， 所 以 设置 wd_o 
为 inst_i[20:16]。 


要 读 取 的 寄存 器 : 参考 图 9-1 可 知 ， 计 算 加 载 目 标 地 址 需要 使 
用 到 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 端 口 1 读 取 寄 存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 regl_addr_ o 是 指令 的 第 21 人 25bit， 正 是 了 pb 指令 中 的 
base。 所 以 最 终 译 码 阶段 的 输出 regl._o 就 是 地 址 为 base 的 寄存 
器 的 值 。 

要 执行 的 运算 : 设置 alusel 0 为 EXE_RES_LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o 为 EXE_LB_OP， 表 示 运 
算 子 类 型 是 字 节 加 载 1b。 


lbu、lh、lhu、1w 指 令 与 lb 指令 的 译 码 过 程 类 似 ， 只 是 aluop_o 的 值 


个 同 。 


(2) lwl 指 令 


要 写 的 目的 寄存 器 : 加 载 指 令 ]wl 需 要 将 加 载 结 果 写 入 目的 寄 
存 器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 参考 图 9-6 可 知 ， 
要 写 的 目的 寄存 器 地 址 是 指令 中 的 第 16~20bit， 所 以 设置 
wd_o 为 inst_i[20:16]。 

要 读 取 的 寄存 器 : 参考 图 9-6 可 知 ， 计 算 加 载 目 标 地 址 需要 使 
用 到 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 端口 1 读 取 寄 存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 regl_addr_ o 是 指令 的 第 21 人 25bit， 正 是 lwl 指 令 中 的 
base。 所 以 最 终 译 码 阶 段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 
器 的 值 。 此 外 ， 由 于 lwl 指 令 只 是 部 分 地 修改 目的 寄存 器 ， 所 
以 还 需要 读 出 目的 寄存 器 ， 与 IJwl 指 令 加 载 得 到 的 结果 进行 组 
合 ， 最 终 写 入 目的 寄存 器 ， 因 此 ， 设 置 reg2_read_o 也 为 1， 表 
示 通 过 Regfile 模 块 的 读 端 口 2? 读 取 寄 存 器 的 值 ， 默 认 读 取 的 寄 


存 器 地 址 reg2_addr_o 是 指令 的 第 16~20bit， 正 是 lwl 指 令 中 的 
rt。 所 以 最 终 译 码 阶段 的 输出 reg2_o 就 是 地 址 为 rt 的 寄存 器 的 
值 。 

。 要 执行 的 运算 : 设置 alusel_o 为 EXE_RES_LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o0 为 EXE_LWL_OP， 表 示 
运算 子 类 型 是 向 左 加 载 Iwl。 


lwr 指 令 与 lwl 指 令 的 译 码 过 程 类 似 ， 只 是 aluop_o 的 值 不 同 。 
(3) sb 指令 


。 BEWAWatras: 存储 指令 sb 不 需要 写 通 用 寄存 器 ， 所 以 设 
置 wreg_o 为 WriteDisable。 

。 要 读 取 的 寄存 器 : 参考 图 9-2 可 知 ， 计 算 存 储 目标 地 址 需要 使 
用 的 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 示 
通过 Regfile 模 块 的 读 端口 1 读 取 寄 存 器 的 值 ， 默 认 读 取 的 寄存 
器 地 址 regl_addr_ o 是 指令 的 第 21 人 25bit， 正 是 sb 指令 中 的 
base。 所 以 最 终 译 码 阶段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 
器 的 值 。 要 存储 的 值 是 通用 寄存 器 的 值 ， 所 以 设置 reg2_read_o 
为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 2? 读 取 寄 存 器 的 值 ， 默 认 读 
取 的 寄存 器 地 址 reg2_addr_o 是 指令 的 第 16~20bit， 正 是 sb 指令 
中 的 rt。 所 以 最 终 译 码 阶段 的 输出 reg2_o 就 是 地 址 为 rt 的 寄存 器 
的 值 。 

。 要 执行 的 运算 : 设置 alusel o 为 EXE_RES_ LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存储 指令 ， 设 置 aluop o 为 EXE_SB_ OP， 表 
示 运 算 子 类 型 是 字 节 存储 sb。 


sh、sw、swr、swl 指 令 与 sb 指令 的 译 码 过 程 类 似 ， 只 是 aluop_o 的 值 
不 同 。 


2. 修改 ID/EX 模 块 


参考 图 9-19 可 知 ，ID/EX 模 块 需要 增加 部 分 接口 ， 用 于 将 I 有 DD 模块 新 
增加 的 输出 信号 inst_o 传 递 到 执行 阶段 的 EX 模块 。 如 表 9-2 所 示 。 


92 ”ID/EX 模 块 新 增加 的 接口 描述 


EEE TET CCT [ea 


2 fexint | 


修改 译 码 阶段 的 ID/EX 模 块 如 下 。 完 整 代码 位 于 本 书 附带 光盘 中 
Code\Chapter9_1 目 录 下 的 id_ex.v 文 件 中 。 


module id_ex( 


input wire[ “RegBus] id inst, // REIDRANGESF 


output reg[ RegBus] ex _ inst // BEHIEXER 


9.3.2 ”修改 执行 阶段 
1. 修改 EX 模块 


在 执行 阶段 的 EX 模块 会 计算 加 载 存 储 的 目的 地 址 ， 人 参考 图 9-19 可 
若 ，EX 模 块 会 增加 部 分 接口 ， 如 表 9-3 所 示 。 


表 9-3 EX 模块 新 增加 接口 的 描述 


序 号 接口 名 RE (bit) 输入 /输出 作 H 
1 inst i 32 从 当前 处 于 执行 阶段 的 指令 
2 aluop_o 8 fa tL 执行 阶段 的 指令 要 进行 的 运算 子 类 型 


T IR. FAIRE 
存储 指令 要 存储 的 数据 , 或 者 lwl、lwr 指令 
E H A R Are N RE 


修改 执行 阶段 的 EX 模块 如 下 。 完 整 代 码 位 于 本 书 附带 光盘 中 
Code\Chapter9_1 目 录 下 的 ex.v 文 件 中 。 


module ex( 


// 新 增 输入 接口 nst_i， 其 值 就 是 当前 处 于 执行 阶段 的 指令 


input wire[ RegBus] inst_i, 


// 下 面 新 增 的 几 个 输出 接口 是 为 加 载 、 存 储 指令 准备 的 


output wire[ ~ AluOpBus ] aluop_o, 
output wire[ RegBus ] mem_addr_o, 
output wire[ RegBus ] reg2_o, 


); 


//aluop_o 会 传递 到 访 存 阶段 ， 届 时 将 利用 其 确定 加 载 、 存 储 类 型 


assign aluop_o = aluop_i; 


//mem_addr_o 会 传递 到 访 存 阶段 ， 是 加 载 、 存 储 指 令 对 应 的 存储 器 地 址 ， 此 
处 的 reg1 i 
// 就 是 加 载 、 存 储 指令 中 地 址 为 base 的 通用 宵 存 器 的 值 ，inst_i[15:0] 就 是 


//offset。 通 过 mem_addr_o 的 计算 ， 读 者 也 可 以 明白 为 何 要 在 译 码 阶段 ID 模 
块 新 增 输 
// 出 接口 inst_o 
assign mem_addr_o = regi_i 十 


{{16{inst_i[15]}}, inst_i[15:0]}; 


//reg2_i 是 存储 指令 要 存储 的 数据 ， 或 者 lwl1、lwr 指 令 要 加 载 到 的 目的 寄存 
器 的 原始 值 ， 
// 将 该 值 通过 reg2_o 接 口传 递 到 访 存 阶段 


assign reg2_o = reg2_i; 


2. 修改 FX/MEM 模 块 


参考 图 9-19 可 知 ，EX/MEM 模 块 会 增加 部 分 接口 ， 用 于 将 EX 模块 
新 增 的 输出 传递 到 访 存 阶段 ， 增 加 的 接口 描述 如 表 9-4 所 示 。 


79-4 EX/MEM 模 块 新 增加 接口 的 描述 


接口 名 宽度 (bit) 输入 /输出 


行 阶段 的 加 载 、 存 储 指令 对 应 的 存储 器 
ex_mem_addr 输入 

行 阶段 的 存储 指令 要 存储 的 数据 ， 或 者 

ex_reg2 输入 和 

人 要 与 入 的 目的 寄存 叭 的 原始 值 


32 
32 
32 
32 


ms 访 存 阶段 的 加 载 、 存 储 指 令 对 应 的 存储 器 
mem_mem_addr 出 
访 存 阶段 的 存储 指令 要 存储 的 数据 ， 或 者 
1i = E e fey SSS BLY [HL fr 
= wr 指 令 要 写 入 的 目的 寄存 器 的 原始 值 


修改 执行 阶段 的 EX/MEM 模 块 如 下 ， 只 是 一 个 简单 的 传递 操作 ， 当 
流水 线 的 执行 阶段 没有 被 暂停 时 ， 将 来 自 执行 阶段 EX 模块 的 输出 传递 
到 访 存 阶 段 。 完 整 代码 请 参考 本 书 附带 光盘 Code\Chapter9_1 目 录 下 的 
ex_mem.v 文 件 。 


mem reg2 


module ex_mem( 


// 为 实现 加 载 、 存 储 指令 而 添加 的 输入 接口 


input wire[ ~AluOpBus ] ex_aluop, 
input wire[ RegBus ] ex_mem_addr, 
input wire[ RegBus ] ex_reg2, 


// 为 实现 加 载 、 存 储 指令 而 添加 的 输出 接口 
output reg['Alu0pBus] mem_aluop, 


output reg[ RegBus] mem_mem_addr, 


mem_aluop <= ex_aluop; 
mem_mem_addr <= ex_mem_addr; 
mem_reg2 <= ex_reg2; 


end else begin 


endmodule 


9.3.3 ”修改 访 存 阶段 


访 存 阶段 主要 是 修改 MEM 模 块 ， 参 考 图 9-19 可 知 ， 需 要 为 其 


对 数据 存储 器 RAM 的 访问 接口 ， 添 加 的 接口 描述 如 表 9-5 所 示 。 
表 9-5 MEM 模 块 新 增加 接口 的 描述 


输入 /输出 


, 访 存 阶段 的 加 载 、 存 储 指令 对 应 的 存储 器 
2 mem addr 1 | 32 
a 地 址 


输入 /输出 {E 


访 存 阶 段 的 存储 指令 要 存储 的 数据 ， 或 者 
lwh, Iwr 指令 要 写 入 的 目的 寄存 器 的 原始 值 

从 数据 存储 器 读 取 的 数据 

要 访问 的 数据 存储 器 的 地 址 


mA 


mem we o fal 是 否 是 写 操作 ， 为 1 表示 是 写 操作 


An Ez = DH 5 ES 
mem sel o HALA T 


mem data o | 32 fi 要 写 入 数据 存储 器 的 数据 


mem ce o i 数据 存储 器 使 能 信号 


Sr 


IN 


加 


从 图 9-19 可 知 ， 表 9-5 后 面 的 几 个 新 增 接口 mem data i、 
mem addr 0o0、mem we _ 0、mem sel o、mem_data_o、mem_ce_o 都 是 
与 数据 存储 器 相连 的 ， 其 中 大 部 分 接口 的 作用 都 很 好 理解 ， 此 处 只 对 
mem_sel_o 做 进一步 说 明 ， 分 加 载 、 存 储 两 种 操作 分 别 说 明 。 


(1) 对 于 加 载 操 作 ，MIPS32 指 令 集 架 构 中 定义 的 加 载 指令 可 以 加 
载 字 节 、 半 字 、 字 ， 但 是 数据 总 线 的 宽度 是 32 位 ， 占 4 个 字 节 。 如 果 执 
行 加 载 字 节 指令 ]jb、lbu， 那 么 就 要 知道 通过 数据 总 线 输 入 的 4 个 字 节 
中 ， 哪 个 字 节 是 要 读 取 的 数据 ; 如 果 执 行 加 载 半 字 指 令 h、lhu， 那 么 
就 要 知道 哪个 半 字 是 要 读 取 的 数据 ，mem_sel_o 的 作用 就 是 指出 哪 一 部 
分 是 有 效 数据 。mem_sel_o 宽 度 为 4， 分 别 对 应 数据 总 线 的 4 个 字 节 ， 比 
如 : 使 用 加 载 指令 jb 读 取 数据 存储 器 地 址 0x1 处 的 字 节 ， 那 么 可 以 设置 
mem_sel o 为 4b0100， 意 思 就 是 ， 和 希望 外 部 存储 器 在 输出 数据 时 ， 将 地 
址 0x1 处 的 字 节 放 在 32 位 数据 总 线 的 次 高 字 节 ， 也 就 是 第 16 人 23bit 的 位 
置 ， 当 数据 送 到 处 理 器 时 ， 处 理 器 就 取出 其 中 第 16~~23bit 对 应 的 字 
节 ， 作 为 数据 存储 器 地 址 0x1 处 的 值 。 


(2) 对 于 存储 操作 ，MIPS32 指 令 集 架构 中 定义 的 存储 指令 可 以 存 
储 字 节 、 半 字 、 字 ， 但 是 数据 总 线 的 宽度 是 32 位 ， 占 4 个 字 节 ， 如 果 执 
行 字 节 存 储 指令 sb、 半 字 存 储 指令 sh， 那 么 外 部 数据 存储 器 就 要 知道 通 
过 数据 总 线 传递 过 来 的 4 个 字 节 中 ， 哪 个 字 节 、 哪 个 半 字 是 要 存储 的 数 
据 ，mem_sel_o 的 作用 就 是 指出 哪 一 部 分 是 要 存储 的 有 效 数 据 。 比 如 : 
使 用 存储 指令 sh 向 地 址 0x2 处 存储 0x8281， 那 么 可 以 设置 mem_data_o 为 
0x82818281、 设 置 mem_sel_o 为 4b0011， 这 样 外 部 存储 器 就 知道 要 存储 
的 数据 是 0x82818281 的 最 低 两 个 字 节 ， 正 是 0x8281。 


访 存 阶段 MEM 模 块 的 代码 主要 修改 如 下 ， 完 整 代 码 请 读者 参考 本 
书 附带 光盘 中 Code\Chapter9_1 目 录 下 的 mem.v 文 件 。 


end 
default: begin 
//do nothing 
end 
endcase 
end 


end 


endmodule 


上 面 的 代码 虽然 很 长 ， — 作用 也 很 明确 ， 就 是 依据 不 
同 的 加 载 、 存 储 指 令 类 型 ， 给 出 mem addro、mem we o、 
mem_sel o、mem_data_o、wdata_o 等 接口 的 值 。 下 面 对 其 中 几 个 典型 
虽 令 的 访 存 过 程 进 行 解释 。 


1. lb 指令 的 访 存 过 程 


(1) 因为 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnable。 
(2) 因为 是 加 载 操作 ， 所 以 设置 mem_we_o 为 WriteDisable。 


(3) 给 出 要 访问 的 数据 存储 器 地 址 mem_addr_ o， 其 值 就 是 执行 阶 
段 计 算出 来 的 地 址 mem _addr i。 


(4) 依据 mem_addr i 的 最 后 两 位 ， 确 定 mem_sel_o 的 值 ， 并 据 此 
从 数据 存储 器 的 输入 数据 mem_data_i 中 获得 要 读 取 的 字 节 ， 进 行 符号 扩 
展 。 比 如 : 如 果 mem_addr i 的 最 后 两 位 是 01， 那 么 设置 mem_sel_o 为 
4b0100， 表 示 希 望 数 据 存 储 器 给 出 的 数据 的 第 16~23bit 就 是 要 读 取 的 


mn, ae | 


字 节 ， 也 就 是 mem_data_i[23:16]， 将 其 最 高 位 进行 符号 扩展 ， 得 到 最 终 
的 结果 wdata o ， 作 为 要 写 入 目标 寄存 器 的 数据 ， 读 者 如 果 有 忘记 了 
wdata_o 的 作用 ， 可 以 参考 4.2.7 节 ori 指 令 实 现 过 程 访 存 阶 段 的 说 明 。 


有 些 读者 可 能 会 感到 疑惑 ， 为 何不 直接 设置 mem_sel o 为 4b0001， 
表示 希望 数据 存储 器 给 出 的 数据 的 第 0 人 7bit 就 是 要 读 取 的 字 节 ， 而 不 
考虑 mem_addr i 的 最 后 两 位 为 何 值 ， 这 样 不 是 更 简单 吗 ? 的 确 ， 这 样 
做 是 更 简单 了 ， 但 是 这 里 确定 mem_sel o 值 的 过 程 实际 上 参考 了 
Wishbone 总 线 的 相关 规范 ， 为 的 是 在 后 期 给 OpenMIPS 添 加 Wishbone 总 
线 接口 的 时 候 容 易 一 些 。 在 本 章 ， 读 者 可 以 简单 地 认为 : 外 部 的 数据 存 
储 器 并 没有 依据 mem_addr_o 地 址 读 取 数据 ， 而 是 将 mem_addr_o 地 址 的 
最 后 两 位 修改 为 0， 依 据 修改 后 的 地 址 读 取 数 据 ， 所 以 OpenMIPS 需 要 依 
据 mem_addr_o 最 后 两 位 的 值 ， 确 定 要 读 取 的 字 节 。 如 图 9-21 所 示 。 


OpenMIPS 数据 存储 器 RAM 


(1) 读 取 地 址 mem_addr_ o 的 字 节 


(2) 返回 地 址 fmem_addr_ o[31:2],2b00} 的 字 
< 


I J K L 


(3) 依据 mem_addr_o[1:0] 的 
值 ， 确 定 最 终 要 读 取 的 字 节 
mem addr o[1:0] 
2b00 [FI 
2'b01 | I 
2'b10 | 1 
2'b11 | 1 


J 
J 
J 
J 


ALALALA 
Zur Om 


图 9-21 hb 指令 的 访 存 过 程 


lbu、hh、jlhu、1lw 指 令 的 访 存 过 程 与 b 指 令 类 似 ， 可 以 对 照 理解 。 


2. lwl 指 令 的 访 存 过 程 


(1) 因为 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnable。 
(2) 因为 是 加 载 操作 ， 所 以 设置 mem_we_o 为 WriteDisable。 


(3) 给 出 要 访问 的 数据 存储 器 地 址 mem_addr_ o， 其 值 就 是 执行 阶 
段 计 算出 来 的 地 址 mem_addr_i， 但 最 后 两 位 要 设置 为 0， 因 为 Iwl 指 令 
从 RAM 中 读 出 一 个 字 ， 所 以 需要 将 地 址 对 齐 ， 同 时 设置 mem_sel_o 为 
4b1111。 


(4) 依据 mem_addr i 的 最 后 两 位 ， 将 从 数据 存储 器 读 取 的 数据 
mem_data i 与 目的 寄存 器 的 原始 值 reg2 i 进行 组 合 ， 得 到 最 终 要 写 入 目 
的 寄存 器 的 值 wdata_o， 组 合 过 程 可 以 参考 图 9-8。 


lw 指令 的 访 存 过 程 与 lwl 指 令 类 似 ， 可 以 对 照 理解 。 
3. sb 指令 的 访 存 过 程 


(1) 因为 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnable。 
(2) 因为 是 存储 操作 ， 所 以 设置 mem_we_o 为 WriteEnable。 


(3) 给 出 要 访问 的 数据 存储 器 地 址 mem_addr_ o， 其 值 就 是 执行 阶 
段 计 算出 来 的 地 址 mem _addr i。 


(4) sb 指令 要 写 入 的 数据 是 寄存 器 的 最 低 字 节 ， 将 该 字 节 复制 到 
mem_data_0 的 其 余部 分 ， 然 后 依据 mem_addr i 的 最 后 两 位 ， 确 定 
mem_sel_o 的 值 。 比 如 : 如 果 mem addr i 的 最 后 两 位 是 01， 那 么 设置 
mem_sel_ 0 为 4b0100 ， 表 示 第 16 人 23bit 就 是 要 写 入 的 字 节 B 
mem_data_0[23:16]o 


读者 可 能 又 会 有 疑惑 ， 为 何不 直接 设置 mem_sel _o 的 值 为 4b0001， 
而 不 用 考虑 mem_addr o 最 低 两 位 的 值 ， 不 用 将 最 低 字 节 复 制 到 
mem_data_o 的 其 余部 分 呢 ? 理由 与 lb 指令 一 样 ， 此 处 确定 mem_sel_o 值 
的 过 程 实际 上 参考 了 Wishbone 总线 的 相关 规范 ， 为 的 是 后 期 给 
OpenMIPS 添 加 Wishbone 总 线 接口 的 时 候 容 易 一 些 。 现 在 ， 大 家 可 以 简 
单 地 认为 ， 外 部 的 数据 存储 器 并 没有 依据 mem_addr_o 存 储 数据 ， 而 是 
将 mem_addr_ o 的 最 后 两 位 修改 为 0， 依 据 修改 后 的 地 址 存储 数据 ， 所 以 
OpenMIPS 需 要 依据 mem_addr_o 最 后 两 位 的 值 ， 确 定 mem_sel_o 的 值 ， 
同时 将 最 低 字 节 复 制 到 mem data o 的 其 余部 分 ， 这 样 保 证 无 论 
mem_sel o 为 何 值 ， 写 入 字 节 始终 是 寄存 器 的 最 低 字 节 。 如 图 9-22 所 
示 。 

OpenMIPS 数据 存储 器 RAM 


(1) 将 e 写 入 地 址 mem_addr oo。 依据 
mem _addr_o[1:0] 的 值 ， 给 出 mem_sel_o 的 值 
> 


e e e e 


(2) 地 址 {mem_addr_o[31:2],2'b00} 
对 应 的 字 是 


I J K L 


(3) 依据 mem_sel_o 的 值 ， 
确定 最 终 要 写 入 的 字 节 


mem_sel_0[3:0] 


4'b1000 e J K L 
4'b0100 I mK | L 
4'b0010 I J e L 
4'b0001 I J| K We 


图 9-22 ”sb 指令 的 访 存 过 程 


sh、sw 指 令 的 访 存 过 程 与 sb 指令 类 似 ， 可 以 对 照 理解 。 
4. swl 指 令 的 访 存 过 程 


(1) 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnable。 


(2) 因为 是 存储 操作 ， 所 以 设置 mem_we_o 为 WriteEnable。 


(3) 给 出 要 访问 的 数据 存储 器 地 址 mem_addr_ o， 其 值 就 是 执行 阶 
aa. addr i， 但 最 后 两 位 要 设置 为 0， 因 为 swl 指 令 最 
可 能 需要 向 数据 存储 器 写 入 一 个 字 ， 所 以 这 里 将 地 址 对 齐 。 


(4) 依据 mem_addr i 的 最 后 两 位 ， 确 定 最 终 要 写 入 数据 存储 器 的 
数据 是 读 出 的 寄存 器 值 reg2 i 的 哪 一 部 分 ， 从 而 给 出 mem_sel_o 的 值 ， 
这 一 确定 过 程 可 以 参考 图 9-14。 


swr 指 令 的 访 存 过 程 与 sw] 指 令 类 似 ) Aj 以 对 外 照 理解 Fo 


9.3.4 ”修改 OpenMIPS 顶 层 模块 


由 于 部 分 模块 增加 了 接口 ， 所 以 需要 修改 顶层 模块 OpenMIPS， 以 
便 将 新 的 接口 连接 起 来 。 同 时 ， 从 图 9-19 可 知 ，MEM 模 块 增加 了 几 个 
对 数据 存储 器 的 接口 ， 而 这 几 个 接口 连接 到 OpenMIPS 外 部 ， 所 以 
OpenMIPS 模 块 的 接口 也 要 做 修改 ， 新 增 接口 如 表 9-6 所 示 ， 修 改 后 的 
OpenMIPS 处 理 器 接口 图 如 图 9-23 所 示 ， 大 家 可 以 与 图 4-6 做 一 对 比 。 


表 9-6 ”OpenMIPS 模 块 新 增加 接口 的 描述 


宽度 (bit) | 输入 /输出 E HF 
输入 从 数据 存储 器 读 取 的 数据 


ram data 1 
ram wi 


o [fat 是 在 是 对 数据 存储 器 的 写 操作 ， 为 1 表示 是 写 操作 
data o 要 写 入 数据 存储 器 的 数据 
o 


数据 存储 器 使 能 信号 


OpenMIPS 


rom_ce_o 
rom_addr_o 
ram_ce_o 


ram_addr_o 
ram_data_o 
ram_sel_o 
ram_we_o 


openmips.v 
图 9-23 ”修改 后 的 OpenMIPS 处 理 器 接口 图 


要 修改 OpenMIPS 模 块 ， 将 表 9-6 中 的 数据 存储 器 接口 与 MEM 模 块 
的 对 应 接口 连接 在 一 起 ， 主 要 修改 如 下 。 完 整 代码 请 参考 本 书 附带 光盘 
中 Code\Chapter9_1 目 录 下 的 openmips.v 文 件 。 


endmodule 


9.4 ”修改 最 小 SOPC 


为 了 验证 上 一 节 添 加 的 加 载 存 储 指令 是 否 实现 正确 ， 需 要 修改 在 第 
4 章 中 设计 的 最 小 SOPC， 为 其 添加 数据 存储 器 RAM。 


9.4.1 ”添加 数据 存储 器 RAM 


数据 存储 器 RAM 的 接口 如 图 9-24 所 示 ， 还 是 采用 左边 是 输入 接 
口 ， 右 边 是 输出 接口 的 方式 绘制 ， 这 样 便于 理解 。 接 口 的 含义 如 表 9-7 
所 示 。 


RAM 


data_ram.v 
El9-24 ”数据 存储 器 RAM 模 块 接口 图 


9-7 数据 存储 器 RAM 的 接口 描述 


输入 /输出 作 
数据 存储 器 使 能 信号 
时 钟 信号 


要 写 入 的 数据 


要 访问 的 地 址 
是 否 是 写 操作 ， 为 1 表示 是 写 操作 
字 节 选择 信号 


读 出 的 数据 


数据 存储 器 RAM 模 块 的 代码 如 下 ， 源 文件 是 本 书 附带 光盘 中 
Code\Chapter9_1 目 录 下 的 data_ram.v 文 件 。 


module data_ram( 


input wire clk, 

input wire ce, 

input wire we, 

input wire['DataAddrBus] addr, 
input wire[3:0] sel, 
input wire['DataBus] data_i, 
output reg[ DataBus ] data_o 


); 
// 定义 四 个 字 节 数组 
reg[ ByteWidth] data_memO0[0: DataMemNum-1]; 
reg[ ByteWidth] data_mem1[®: "DataMemNum-1]; 
reg[ ByteWidth] data_mem2[0: DataMemNum-1]; 
reg[ ByteWidth] data_mem3[0: DataMemNum-1]; 


data_o <= "ZeroWord; 
end else if(we == "WriteDisable) begin 
data_o <= {data_mem3[addr[ DataMemNumLog2+1:2]], 
data_mem2[addr[ 'DataMemNumLog2+1:2]], 
data_memi[addr[ 'DataMemNumLog2+1:2]], 
data_memO[addr[ DataMemNumLog2+1:2]]}; 
end else begin 
data_o <= "ZeroWord; 
end 


end 


endmodule 


其 中 涉及 到 的 相关 宏 定 义 在 defines.v 中 定义 ， 如 下 : 


‘define DataAddrBus 31:0 // 地 址 总 线 宽度 

‘define DataBus 31:0 // 数 据 总 线 宽度 

‘define DataMemNum 131071 //RAM 的 大 小 ， 单 位 是 字 ， 此 处 是 
128K word 

‘define DataMemNumLog2 17 // 实 际 使 用 的 地 址 宽度 

“define ByteWidth 7:0 // 一 个 字 节 的 宽度 ， 是 8bit 


为 了 方便 实现 对 数据 存储 器 按 字 节 寻 址 ， 在 设计 的 时 候 使 用 4 个 8 位 
存储 器 代替 一 个 32 位 存储 器 ， 如 图 9-25 所 示 ， 读 操作 时 ， 从 4 个 8 位 存储 
器 中 各 读 出 一 个 字 节 ， 组 合 为 一 个 32 位 的 数据 输出 ， 写 操作 时 ， 依 据 
sel 的 值 ， 修 改 其 中 特定 存储 器 对 应 的 字 节 即 可 。 因 此 ， 地 址 addr 的 最 低 
两 位 不 需要 使 用 ， 比 如 : 读 取 地 址 n 处 的 字 ， 实 际 就 是 从 4 个 8 位 存储 器 


的 地 址 n/4 处 各 读 取 一 个 字 节 ， 
合 本 节 实 现 的 数据 存储 器 理解 9.3.3 节 中 MEM 模 块 的 输出 。 


组 合 起 来 就 来 地 址 n 处 的 字 。 


读者 可 以 结 


地 址 


iss) 
a 
ot 
oO 
or N ww 


data_mem3 


Byte Byte Byte 
Byte 3 Byte 3 Byte 
Byte 2 Byte 2 Byte 
Byte 1 Byte 1 Byte 
Byte 0 Byte 0 Byte 
data_mem2 data_meml data_memO 


O =- NW 


of œ oO 


图 9-25 ”32 位 数据 存储 器 由 4 个 8 位 数据 存储 器 构成 


9.4.2 ”修改 最 小 SOPC 


添加 数据 存储 器 RAM 后 的 SOPC 如 图 9-26 所 示 。 读 者 可 以 与 图 4-9 对 


比 。 


ROM 
>> ce inst 
OpenMIPS 
rst rom_ce_o dr] addr 
clk rom_addr_o inst_rom.v 
m~~ rom_data_i RAM 
ram_addr_o }—————_ addr 
— » ram_data_i tam_data_o > data Ao 
ram_sel_o c sel 
ram_we_o |_| we 
ram_ce_o ce 
openmips.v clk 
data_ram.v 


图 9-26 “添加 数据 存储 器 RAM 后 的 最 小 SOPC 


此 处 需要 修改 openmips_min_sopc.v， 在 其 中 将 OpenMIPS、ROM、 
RAM 按 照 图 9-26 所 示 连 接 起 来 ， 具 体 代 码 没 有 在 书 中 列 出 ， 读 者 可 以 
参考 本 附带 光盘 中 Code\Chapter9_1 目 录 下 的 同名 文件 。 


9.5 ”测试 程序 


下 面 的 测试 程序 是 用 来 验证 前 几 节 实现 的 加 载 存 储 指令 (BRILL sc 
ES) 是 否 正 确 ， 程 序 的 注释 给 出 了 预期 执行 效果 。 源 文件 是 本 书 附 融 
光盘 Code\Chapter9_1\AsmTest 目 录 下 的 inst_rom.S 文 件 。 


.Org 0x0 

.Set noat 

.set noreorder 
.Set nomacro 


.global _start 


Estant: 
HHHHHHHHHHHHHH 第 一 段 : I sb, lb, lbu # $ 
################ 
ori $3, $0, Oxeeff # $3 = 0x0000eeff 
sb $3, 0x3($0) # 向 RAM 地 址 9x3 处 存储 0xff， [0x3] = Oxff 
srl $3,$3,8 # 逻辑 右 移 8 位 ，$3 = 0x000000ee 


sb $3, 0x2($0) # 向 RAM 地 址 9x2 处 存储 0xee， [0x2] = Oxee 


j _loop 


nop 


上 面 的 测试 代码 可 分 为 四 段 ， 分 别 测试 了 不 同 的 加 载 、 存 储 指令 ， 
在 ModelSim 中 的 仿真 效果 如 图 9-27 所 示 ， 通 过 观察 宵 存 器 $1 的 变化 ， 
可 知 OpenMIPS 处 理 器 正确 实现 了 加 载 存 储 指 令 。 


reg[3] 就 是 $3 的 值 ” KY 


® rst Sto li 
de dk sto | | | | | l un | | | | l | 
54 regfilei/regs[3] 00... [000000ee  Jo000ccdd joo000ce ~ o S SSS o oOo 
5-4 reofile1/regs[1] foo... iii D00000ee 
reg[1] 就 是 $1 的 值 a 
(1) 第 一 段 代 码 ，sb、Ib、lbu 的 执行 效果 
® rst sto 
® dk Sti 


E-e regfile1/regs[3] 
5-4 regfile1/regs[1] 


(2) 第 二 段 代 码 ，sh、Ih、lhu 的 执行 效果 


(3) 第 三 段 代 码 ，sw、lw、1lwl、1wr 的 执行 效果 
® rst 
® dk 
3-4 regfilei/regs[3] 
5-4 regfile 1/regs[1] 


aa... 


(4) 第 四 段 代码 ，swl、swr 的 执行 效果 


图 9-27 ModelSim 仿 真 测试 加 载 、 存 储 指令 的 执行 效果 


9.6 RMS. RAS 
令 sc 说 明 


在 本 章 前 面 的 部 分 ， 笔 者 伦 费 很 多 笔墨 介绍 了 OpenMIPS 中 除 11、sc 
之 外 的 加 载 、 存 储 指令 的 实现 过 程 ， 本 节 至 9.9 节 将 专门 介绍 链接 加 载 


指令 11、 条 件 存 储 指令 sc 的 实现 过 程 。11、sc 指 令 是 MIPS32 指 令 集 以 构 
中 比较 特殊 的 加 载 存储 指令 ， 用 来 实现 信号 量 机 制 。 


在 多 线程 系统 中 ， 需 要 RMW (Read-Modify-Write) 操作 序列 保证 
对 某 个 资源 的 独占 性 ，RMW 操 作 序列 的 含义 是 ， 读 取 内 存 某 个 地 址 的 
数据 ， 读 取 的 数据 经 过 修改 ， 然 后 再 保存 回 内 存 原 地 址 ， 这 个 过 程 不 能 
有 任何 打扰 ， 因 此 需要 建立 一 个 临界 区 域 (Critical Region) ， 临 界 区 
域 中 完成 的 操作 通常 称 为 原子 操作 ， 原 子 操作 不 被 打扰 。 操 作 系 统 建立 
临界 区 域 的 方式 通常 是 信号 量 机 制 ， 如 下 。 


wait (semaphore) ; 


原子 操作 ; 


signal (semaphore) ; 


semaphore 是 一 个 信号 量 ， 为 1 表示 信号 量 使 用 中 ， 为 0 表示 信号 量 
空 币 。 进 行 原 子 操作 前 ， 使 用 wait 国 数 查 询 semaphore 的 值 ， 如 果 为 1， 
则 等 待 ， 否 则 ， 将 其 置 为 1， 开 始 执行 原子 操作 。 操 作 结束 后 ，signal 函 
数 将 semaphore 置 为 0， 这 样 其 他 线程 就 可 以 执行 原子 操作 了 。 


需要 注意 的 是 ，wait 函 数 的 执行 也 是 一 个 原子 操作 ， 是 一 种 * 先 检 
测 后 设置 > 操作 (test-and-set operation) ， 这 种 操作 一 般 不 希望 被 外 部 
设备 中 断 ， 也 不 希望 被 其 他 线程 打 断 ， 很 多 处 理 器 都 有 专门 的 指令 用 来 
实现 “ 先 检测 后 设置 ”操作 ， 比 如: 680x0 CPU、x86 CPU 等 。 这 也 是 一 
种 信号 量 机 制 。 


MIPS32 架 构 采 用 特殊 的 方式 实现 信号 量 机 制 ， 对 于 原子 操作 ， 
MIPS32 架 构 并 不 保证 它 一 定 是 原子 性 的 ， 也 就 是 允许 检测 和 设置 在 没 
有 原子 性 保证 的 情况 下 运行 ， 但 只 在 它 确实 是 原子 的 运行 了 的 时 候 才 让 


“设置 "生效 。MIPS32 架 构 采用 链接 加 载 指 令 11、 条 件 存储 指令 sc 来 实现 
这 种 信号 量 机 制 。 


1 指令 同一 般 的 加 载 指令 一 样 ， 从 内 存 中 加 载 一 个 字 ， 但 是 ， 有 一 
点 不 同 ，11 指 令 还 会 将 处 理 器 内 部 的 一 个 链接 状态 位 LLbit 置 为 1， 表 明 
发 生 了 一 个 链接 加 载 操 作 ， 并 将 链接 加 载 的 地 址 保存 到 一 个 特殊 寄存 器 
LLAddr 中 (这 个 寄存 器 在 多 处 理 器 中 有 作用 ，OpenMIPS 是 单 处 理 器 ， 
所 以 在 OpenMIPS 实 现 过 程 中 并 没有 实现 LLAddr 寄 存 器 ) 。 


1 指令 执行 完毕 后 ， 会 进行 一 定 的 操作 (如 : 修改 加 载 得 到 的 数 
HE) ， 然 后 执行 sc 指令 ， 这 可 以 认为 是 一 个 RMW 序 列 。 有 如 下 两 种 情 
况 干扰 这 个 RMW 序 列 ， 受 到 干扰 后 ， 处 理 器 会 设置 链接 状态 位 LLbit 为 
0o 


。 在 11、sc 指 令 之 间 产 生 异 常 ， 从 而 进入 异常 处 理 例 程 ， 或 者 发 
生 线 程 切 换 ， 导 致 RMW 序 列 受到 干扰 。 

。 多 处 理 器 的 系统 中 ， 另 一 个 CPU 改写 了 RMW 序 列 要 操作 的 内 
存 空间 。 对 于 OpenMIPS 而 言 ， 只 有 第 1 种 情况 。 


执行 sc 指令 时 ， 会 对 从 1 指令 开始 的 RMW 序 列 进行 检查 ， 判 断 是 否 
受到 和 干扰， 实际 就 是 判断 LLbit 是 否 为 1， 如 果 没 有 受到 任何 干 执 ， 
LLbit 保 持 为 1， 那 么 操作 是 原子 的 ，sc 指 令 会 对 1 指令 加 载 数据 的 地 址 
进行 写 回 操作 ， 并 设置 一 个 通用 寄存 器 的 值 为 1， 表 示 成 功 ， 反 之 不 进 
行 写 回 操作 ， 并 设置 一 个 通用 寄存 器 的 值 为 0， 表 示 失 败 。 


1、sc 指 令 的 格式 如 图 9-28 所 示 。 从 图 中 可 知 ， 可 以 依据 指令 码 对 


这 2 条 指令 进行 区 分 。 


31 26 25 21 20 16 15 0 


LL wwe 
110000 base rt offset 1484 
SC — 
111000 base rt offset sc 指令 


图 9-28 ”1l1、sc 指 令 格式 
。 当 指 令 中 的 指令 码 为 6b110000 时 ， 是 1 指令， 链接 加 载 指 令 。 
指令 用 法 为 : 11 rt, offset(base)。 


虽 令 作用 为 : 从 内 存 中 指定 的 加 载 地 址 处 ， 读 取 一 个 字 节 ， 然 后 符 
号 扩展 至 32 位 ， 保 存 到 地 址 为 rt 的 通用 寄存 器 中 。 其 中 加 载 地 址 的 计算 
方法 如 下 。 


加 载 地 址 = signed_extended(offset) + GPR[base] 
此 外 ， 还 要 设置 链接 状态 位 LLbit 为 1。 
。 当 指 令 中 的 指令 码 为 6b111000 时 ， 是 sc 指令 ， 条 件 存 储 指令 。 
指令 用 法 为 : sc rt, offset(base)o 


指令 作用 为 : 如 果 RMW 序 列 没 有 受到 干扰 ， 也 就 是 LLbit 为 1， 那 
么 将 地 址 为 rt 的 通用 寄存 器 的 值 保存 到 内 存 中 指定 的 存储 地 址 处 ， 同 时 
设置 地 址 为 rt 的 通用 寄存 器 的 值 为 1， 设 置 LLbit 为 0。 如 果 RMW 序 列 受 
到 了 干扰 ， 也 就 是 LLbit 为 0， 那 么 不 修改 内 存 ， 同 时 设置 地 址 为 rt 的 通 
用 寄存 器 的 值 为 0。 其 中 存储 地 址 的 计算 方法 如 下 。 


存储 地 址 = signed_extended(offset) + GPR[base] 


下 面 通过 一 个 例子 体会 1、sc 指 令 的 作用 ， 这 个 例子 实现 了 上 面 介 
绍 的 wait 阔 数 ， 不 过 此 处 是 使 用 1]、sc 指 令 实现 的 。 


回 到 调用 过 程 ， 
// 进入 临界 区 域 


9.7 IK sc 指令 实现 思路 
9.7.1 _ 1、sc 指 令 的 实现 


这 2 条 指令 都 涉及 访问 链接 状态 位 LLbit， 可 以 将 LLbit 当 做 寄存 器 
处 理 ，1 指 令 需 要 写 该 寄存 器 ，sc 指 令 需 要 读 该 寄存 器 ， 同 时 ， 与 对 通 
用 寄存 器 的 访问 一 样 ， 对 LLbit 寄 存 器 的 写 操作 也 放 在 回 写 阶段 进行 。 


1 指令 在 访 存 阶段 要 读 取 数 据 存 储 器 中 指定 地 址 的 数据 ， 还 要 设置 
对 LLbit 寄 存 器 的 写 操 作 ， 写 入 的 值 为 1， 这 个 写 操作 会 通过 MEM/WB 
模块 传递 到 回 写 阶 段 ， 最 终 实 现 对 LLbit 寄 存 器 的 写 。 


sc 指令 在 访 存 阶段 要 先 获得 LLbit 寄 存 器 的 值 ， 如 果 该 值 为 1， 那 么 
会 完成 存储 操作 ， 同 时 设置 对 LLbit 寄 存 器 的 写 操作 ， 写 入 的 值 为 0， 还 
要 设置 对 通用 寄存 器 rt 的 写 操 作 ， 写 入 的 值 为 1， 这 些 写 操 作 都 会 通过 
MEMV/WB 模 块 传递 到 回 写 阶段 ， 最 终 实现 对 寄存 器 LLbit、 通 用 寄存 器 
rt 的 写 ; 反之 ， 如 果 LLbit 寄 存 器 的 值 为 0， 那 么 不 进行 存储 操作 ， 同 时 
设置 对 通用 寄存 器 rt 的 写 操 作 ， 写 入 的 值 为 0， 这 个 写 操 作 会 通过 
MEM/WB 模 块 传递 到 回 写 阶段 ， 最 终 实 现 对 通用 寄存 器 rt 的 修改 。 


导致 寄存 器 LLbit 为 0 的 情况 有 : (1) sc 指令 之 前 没有 执行 指令; 
(2) 1 指令 执行 后 、sc 指 令 执行 前 ， 发 生 了 异常 。 


9.7.2 ”数据 流 图 的 修改 


为 了 实现 1、sc 指 令 ， 需 要 对 数据 流 图 作 如 图 9-29 所 示 的 修改 ， 主 


要 是 在 回 写 阶段 新 增 了 一 个 LLbit 寄 存 器 ， 其 中 存储 的 就 是 链接 状态 
位 ， 只 有 在 回 写 阶段 才 会 写 LLbit 寄 存 器 。 同 时 ， 要 将 LLbit 寄 存 器 的 值 
传递 到 访 存 阶段 ， 以 便 供 指令 sc 进行 判断 。 


dee; o 


P| | 指令 m | > 
AE Raia oll LO 
X 
数据 || 一 
i x | 
clk | 


图 9-29 ”为 了 实现 1、sc 指 令 而 修改 的 数据 流 图 


9.7.3 ”系统 结构 的 修改 


为 实现 1、sc 指 令 ， 需 要 对 系统 结构 做 如 图 9-30 所 示 的 修改 ， 新 增 


了 一 个 LLbit 模 块 ， 用 来 实现 LLbit 寄 存 器 。 


OpenMIPS 
访 存 ! 回 写 
1 
MEM MEM/WB 
LLbit 
LLbit we o —>| mem_LLbit_we wb_LLbit_we }——~—_ we 
LLbit value o —>| mem_LLbit_value wb_LLbit_value LP» LLbiti  LLbit_o 
ro flush 
— LLbit_i rst 
pde wb_LLbit_we_i rt elk 
| r> wb_LLbit_value_i i i LLbit_reg.v 
mem.v mem_wb.v 
人 a E E, 
AA A E A N E E. 
4 


图 9-30 “为 实现 11、sc 指 令 而 对 系统 结构 做 的 修改 


在 访 存 阶段 的 MEM 模 块 中 会 进行 分 析 ， 如 果 是 11、sc 指 令 ， 那 么 设 
置 对 LLbit 寄 存 器 的 访问 信息 ， 通 过 LLbit we_o、LLbit_value_o 接 口 输 
出 ， 前 者 表示 是 否 是 写 操 作 ， 后 者 表示 要 写 入 的 值 ， 这 些 信 息 通过 
MEM/WB 模 块 传递 到 回 写 阶段 ， 最 终 修 改 LLbit 寄 存 器 。 


LLbit 寄 存 器 的 值 通过 LLbit_o 接 口 输出 到 MEM 模 块 的 接口 LLbit_j， 
当 sc 指 令 进 入 访 存 阶段 时 会 使 用 该 值 。 


注意 的 是 ， 由 于 对 LLbit 寄 存 器 的 修改 是 在 回 写 阶段 最 后 的 时 
名 上 升 沿 进 和 了 的 ， 如 果 直 接 采 用 LLbit 模 块 给 出 的 LLbit 寄 存 器 的 值 ， 可 
能 不 是 正确 的 值 ， 因 为 此 时 处 于 回 写 阶段 的 指令 可 能 会 修改 LLbit 青 存 
器 ， 这 一 问题 在 第 6 章 添加 HI、LO 寄 存 器 时 也 遇 到 过 ， 解 决 方法 还 是 数 
据 前 推 ， 将 回 写 阶段 指令 对 LLbit 寄 存 器 的 操作 信息 前 推 到 访 存 阶段 ， 
访 存 阶段 依据 这 些 情况 ， 确 定 正 确 的 LLbit 寄 存 器 的 值 ， 所 以 在 图 9-30 
中 ，MEM/WB 模 块 的 输出 信号 wb_LLbit_we、wb_LLbit_value 也 要 送 到 
MEM 模 块 ， 就 是 用 来 解决 数据 相关 问题 的 。 


9.8 ”修改 OpenMIPS 以 实现 1、sc 指 
> 


9.8.1 _LLbit 寄 存 器 的 实现 


LLbit 寄 存 器 在 LLbit 模 块 中 实现 ， 模 块 接口 如 图 9-30 所 示 ， 各 接口 
描述 如 表 9-8 所 示 。 


9-8 ”LLbit 模 块 各 接口 描述 


LL bit i 要 写 到 LLbit 寄存 器 的 值 
LLbit 寄存 器 的 值 


LLbit 寄 存 器 的 代码 如 下 ， 源 文件 是 本 书 光盘 中 Code\Chapter9_2 目 
录 下 的 LLbit_reg.v 文 件 。 


module LLbit_reg( 


input wire clk, 


input wire rst, 


// 异 单 是否 发 生 ， 为 1 表示 异常 发 生 ， 为 9 表示 没有 有 异常 


input wire flush, 


// 写 操作 
input wire LLbit_i, 


input wire we, 


// LLbit 寄 存 器 的 值 
output reg LLbit_o 


); 


always @ (posedge clk) begin 
if (rst == "RstEnable) begin 
LLbit_o <= 1'b0; 
end else if((flush == 1'b1)) begin // 如 果 异 常 发 生 ， 那 么 设 
置 LLbit_o 为 0 
LLbit_o <= 1'b0; 
end else if((we == "WriteEnable)) begin 
LLbit_o <= LLbit_i; 
end 


end 


endmodule 


当 有 异常 发 生 时 ， 会 使 LLbit 寄 存 器 的 值 为 0。 所 以 此 处 有 一 个 输入 
接口 flush， 当 flush 为 1 时， 表示 有 异常 发 生 (在 第 11 章 实现 异常 处 理 的 
时 候 将 详细 介绍 ) ， 从 而 设置 LLbit 寄 存 器 的 值 为 0。 


9.8.2 ”修改 译 码 阶段 的 ID 模块 


在 译 码 阶段 的 ID 模块 要 增加 对 11、sc 指 令 的 译 码 ， 根 据 图 9-28 给 出 
的 11]、sc 指 令 格式 可 得 ， 确 定 1l、sc 指 令 的 过 程 如 图 9-31 所 示 。 


op 一 一 > 164 
= EXE_SC = l ane 
> sc 指令 wire[5:0] op = inst_i[31:26] 
-其 它 
> roo... 


图 9-31 ”确定 1、sc 指 令 的 过 程 


其 中 涉及 的 宏 定 义 如 下 ， 正 是 11、sc 指 令 的 指令 码 ， 在 本 书 附带 光 
盘 中 Code\Chapter9_2 目 录 下 的 defines.v 文 件 可 以 找到 这 些 定义 。 


“define EXE LL 6'b110000 
“define EXE SC 6'b111000 


对 译 码 阶段 ID 模块 的 代码 做 如 下 修改 。 完 整 代码 位 于 本 书 附带 光 
#Code\ChapterI 2 目录 下 的 id.v 文 件 中 。 


module id( 


always @ (*) begin 
if (rst == "RstEnable) begin 
end else begin 


aluop_o <= "EXE_NOP_OP; 


译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 情况 和 要 
执行 的 运算 等 三 个 方面 。 分 别 介绍 如 下 。 


(1) 1 指令 


。 要 写 的 目的 寄存 器 : 链接 加 载 指令 1] 需 要 将 加 载 结 果 写 入 通用 
寄存 器 ， 所 以 设置 wreg_o 为 WriteEnable ， 同 时 参考 图 9-28 可 
知 ， 要 写 的 目的 寄存 器 是 指令 中 的 第 16~~20bit， 所 以 设置 
wd_o 为 inst_i[20:16]。 


。 要 读 取 的 寄存 器 情况 : 参考 图 9-28 可 知 ， 计 算 加 载 目 标 地 址 需 
要 使 用 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 
示 通 过 Regfile 模 块 的 读 端 口 1 读 取 寄存 器 ， 默 认 读 取 的 寄存 器 
地 址 regl_addr_o 是 指令 的 第 21~ 人 25bit， 正 是 1 指令 中 的 base。 
所 以 最 终 译 码 阶 段 的 输出 reg1l_o 就 是 地 址 为 base 的 寄存 器 的 
值 。 

。 要 执行 的 运算 : 设置 alusel_0 为 EXE_RES_LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o 为 EXE_LL_OP， 表 示 运 
算 子 类 型 是 11。 


(2) sc 指令 


。 要 写 的 目的 寄存 器 : 条 件 存储 指令 sc 也 需要 写 通 用 寄存 器 ， 所 
以 也 设置 wreg_o 为 WriteEnable。 这 一 点 是 与 其 余 的 存储 指令 
sb、sh、sw 等 的 重要 区 别 。 要 写 的 目的 寄存 器 是 指令 中 的 第 16 
一 20bit， 所 以 设置 wd_o 为 inst_i[20:16]。 

。 要 读 取 的 寄存 器 情况 : 参考 图 9-28 可 知 ， 计 算 存储 目标 地 址 需 
要 使 用 地 址 为 base 的 寄存 器 值 ， 所 以 设置 regl_read_o 为 1， 表 
示 通 过 Regfile 模 块 的 读 端 口 1 读 取 寄存 器 ， 默 认 读 取 的 寄存 器 
地 址 regl_addr_o 是 指令 的 第 21 人 25bit， 正 是 sc 指令 中 的 base。 
所 以 最 终 译 码 阶 段 的 输出 regl_o 就 是 地 址 为 base 的 寄存 器 的 
值 。 另 外 ， 要 存储 的 值 是 地 址 为 rt 的 通用 寄存 器 的 值 ， 所 以 设 
置 reg2_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端 口 2? 读 取 寄 存 
器 ， 默 认 读 取 的 寄存 器 地 址 reg2_addr o 是 指令 的 第 16 一 
20bit， 正 是 sc 指令 中 的 rt。 所 以 最 终 译 码 阶段 的 输出 reg2_o 就 
是 地 址 为 rt 的 寄存 器 的 值 。 

。 要 执行 的 运算 : 设置 alusel o 为 EXE_RES_ LOAD_STORE， 表 
示 运 算 类 型 是 加 载 存 储 ， 设 置 aluop_o 为 EXE_SC_OP， 表 示 运 


算 子 类 型 是 sc。 


9.8.3 ”修改 访 存 阶段 
1. 修改 MEM 模 块 
参考 图 9.30 可 知 ， 访 存 阶段 的 MEM 模 块 要 新 增 部 分 接口 ， 新 增 接 
口 的 描述 如 表 9-9 所 示 。 
表 9-9 ”MEM 模块 新 增 接口 的 描述 


接口 名 | 宽度 (bit) | 输入 /输出 
LLbit i 输入 LLbit 模块 给 出 的 LLbit 寄存 器 的 值 


wb LLbit we i 输入 回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


wb_LLbit_value_i 输入 回 写 阶段 要 写 入 LLbit 寄存 器 的 值 


LLbit_we_o 输出 访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 


Is LLbit value o 1 访 存 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 


MEM 模 块 主要 修改 的 代码 如 下 ， 完 整 代码 请 参考 本 书 附带 光盘 
Code\Chapter9_ 2 目录 下 的 mem.v 文 件 。 


module mem( 


// 新 增 的 输入 接口 
input wire LLbit_i, 
input wire wb_LLbit_we_i, 


input wire wb_LLbit_value_i, 


if(LLbit == 1'b1) begin 
LLbit_we_o <= 1'b1; 


LLbit_value_o <= 1'b0; 


mem_addr_o <= mem_addr_i; 
mem_we <= "WriteEnable; 
mem_data_o <= reg2_i; 
wdata_o le 
mem_sel_o = Ab 
mem_ce_o <= "ChipEnable; 


end else begin 
wdata_o <= 32 HO, 


end 


endmodule 


MEM 模 块 的 代码 增加 了 一 个 过 程 ， 以 获得 LLbit 寄 存 器 的 最 新 值 ， 
然后 针对 11、sc 指 令 分 别 给 出 了 对 数据 存储 器 的 访问 信息 。 


(1) MES 


。 给 出 要 访问 的 数据 存储 器 地 址 mem_addr o， 其 值 就 是 执行 阶 
段 计 算出 来 的 地 址 mem_addr i， 参考 9.3.2 节 。 

。 因为 是 加 载 操 作 ， 所 以 设置 mem_we_o 为 WriteDisable。 

。 因为 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnable。 


因为 是 加 载 一 个 字 ， 所 以 设置 mem_sel_o 为 4b1111。 
要 写 入 通用 寄存 器 rt 的 值 就 是 从 数据 存储 器 加 载 到 的 数据 


mem data i， 所 以 设置 wdata 0 为 mem data io 


要 置 LLbit 寄 存 器 为 1， 所 以 设置 LLbit_we_0 为 1， 表 示 要 写 
LLbit 寄 存 器 ， 同 时 ， 设 置 LLbit value_o 为 1， 表 示 要 写 入 LLbit 
寄存 器 的 值 为 1。 


(2) sc 指令 


如 果 LLbit 寄 存 器 的 值 为 1， 表 示 之 前 已 执行 过 1 指令 ， 并 且 在 1 指令 


执行 后 、 


当前 sc 指令 执行 前 的 这 段 时 间 内 ， 没 有 异 单 发 生 ， 此 时 ，sc 指 


令 的 访 存 信息 如 下 。 


给 出 要 访问 的 数据 存储 器 地 址 mem_addr_ o， 其 值 就 是 执行 阶 
段 计 算出 来 的 地 址 mem_addr_ i， 参考 9.3.2 节 。 

因为 是 存储 操作 ， 所 以 设置 mem_we_o 为 WriteEnable。 

为 要 访问 数据 存储 器 ， 所 以 设置 mem_ce_o 为 ChipEnableo。 
因为 是 存储 一 个 字 ， 所 以 设置 mem_sel_o 为 4b1111。 

要 存储 的 数据 是 reg2 i， 是 从 译 码 阶段 传递 过 来 的 ， 其 值 就 是 
地 址 为 rt 的 通用 寄存 器 的 值 。 

要 置地 址 为 rt 的 通用 寄存 器 为 1， 所 以 设置 wdata_o 为 1。 

要 置 LLbit 寄 存 器 为 0， 所 以 设置 LLbit we_o 为 1， 表 示 要 写 
LLbit 寄 存 器 ， 同 时 ， 设 置 LLbit_value_o 为 0， 表 示 要 写 入 LLbit 
寄存 器 的 值 为 0。 


反之 ， 如 果 LLbit 的 值 为 0， 表 示 之 前 没有 执行 过 1 指令 ， 或 者 在 ]] 指 
令 执行 后 、 当 前 sc 指令 执行 前 的 这 段 时 间 内 ， 有 有 异常 发 生 ， 此 时 ，sc 指 
令 的 访 存 信息 如 下 。 


© 不 修改 数据 存储 器 ， 所 以 mem_we_o 保 持 默 认 值 WriteDisable， 


mem_ce_o 保 持 默认 值 ChipDisable。 
e 不 修改 LLbit 寄 存 器 的 值 ， 所 以 LLbit_ we_o 保 持 默 认 值 0。 


。 要 置地 址 为 rt 的 通用 寄存 器 为 0， 所 以 设置 wdata_o 为 0。 


2. 修改 MEM/WB 模 块 
从 图 9-30 可 知 ，MEM/WB 模 块 要 新 增 部 分 接口 ， 新 增 接口 的 描述 
如 表 9-10 所 示 。 
表 9-10 MEM/WB 模 块 新 增 接口 的 描述 


Fa mem LLbit value Em 访 存 阶 段 的 指令 要 写 入 LLbit 寄存 器 的 值 


3 wb_LLbit_we 回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 
4 wb_LLbit value 回 写 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 


MEM/WB 模 块 要 修改 的 代码 如 下 ， 作 用 很 直 白 : 在 访 存 阶段 没有 
暂停 时 ， 简 单 地 将 MEM 给 出 的 对 LLbit 寄 存 器 的 写 信息 传递 到 访 存 阶 
段 ， 完 整 代码 请 读者 参考 本 书 附 带 光 盘 Code\Chapter9 2 目录 下 的 
mem_wb.v 文 件 。 


module mem_wb ( 


input wire mem_LLbit_we, 


input wire mem_LLbit_value, 


endmodule 


9.8.4 ”修改 OpenMIPS 模 块 


因为 一 些 模块 增加 了 接口 ， 所 以 要 修改 顶层 模块 OpenMIPS， 以 便 
将 这 些 新 增加 的 接口 按照 图 9-30 所 示 的 关系 连接 起 来 。 具 体 修改 代码 不 
再 给 出 ， 读 者 可 以 参考 本 书 附带 光盘 Code\Chapter9 2 目录 下 的 
openmips.v 文 件 。 


注意 一 点 ， 因 为 目前 还 没有 实现 异常 处 理 ， 所 以 可 以 直接 设置 


LLbit 模 块 的 输入 接口 flush 为 0%， 表 示 没 有 异常 发 生 ， 当 后 续 章 节 实 现 异 
常 处 理 后 ， 表 将 其 连接 到 正确 的 模块 。 


9.9 ”测试 1、sc 指 令 实 现 效果 


通过 如 下 程序 测试 1、sc 指 令 的 实现 效果 。 源 文件 是 位 于 本 书 附带 
光盘 中 Code\Chapter9_2\AsmTest 目 录 下 的 inst_rom.S 文 件 中 。 


.org 0x0 
,Set noat 


,Set noreorder 


nop 


addi $1, $1, 0x1 # 将 读 出 的 数据 加 1，$1 = 0x00001235 
sc $1,0x0($0) # 将 修改 后 的 数据 再 保存 回 数 据 存 储 器 ， 保 存 成 功 会 设 
置 寄存 器 $1， 


# 使 得 $1 = 0x1 


lw $1,0x0($0) # 从 数据 存储 器 0x0 处 加 载 字 ， 以 验证 是 否 是 sc 指令 存 
储 的 数据 ， 
# 执行 完毕 后 ， 使 得 寄存 器 $1 = 0x00001235 


_loop: 


j _loop 


nop 
测试 代码 可 以 分 两 段 理解 。 


第 一 段 : 在 没有 执行 1 指令 的 情况 下 ， 执 行 sc 指 令 ， 此 时 sc 指令 不 
会 修改 数据 存储 器 ， 并 且 会 设置 指令 中 的 通用 寄存 器 rt 为 0。 


第 二 段 : 模仿 Read-Modify-Write 过 程 ， 首 先 执行 1 指令 以 读 取 数 据 
存储 器 地 址 0x0 处 的 字 ， 将 读 出 的 数据 加 1， 然 后 通过 sc 指令 保存 回 数 据 
存储 器 的 地 址 0x0 处 。 


程序 的 注释 已 经 给 出 了 执行 效果 ， 通 过 观察 通用 寄存 器 $1 的 变化 可 
以 验证 11、sc 指 令 是 否 正 确实 现 。ModelSim 仿 真如 图 9-32 所 示 ， 从 仿真 
结果 可 知 ，OpenMIPS 处 理 器 正确 实现 了 11、sc 指 令 。 


de rst sto 
> ck sti |] l | l | l | | | | | | | 
3-4 regfileifregs[1] f000... }00001234 ”加 0005578 加 0000000 }00001234 i 
(1) 测试 程序 第 一 段 的 仿真 结果 
® rst sto 
de dk sto l | | | | | | | | | | | 
B® reafilei/regs[1] 000... [00000000 }00001234 00001235 }00000001 }00001235 


(2) 测试 程序 第 二 段 的 仿真 结果 


图 9-32 ”测试 程序 的 仿真 结 


9.10 load 相关 问题 
9.10.1 load 相关 问题 介绍 


在 之 前 编写 测试 程序 的 时 候 ， 都 很 小 心地 避 开 了 一 个 问题 ， 那 就 是 
load 相 关 问题 ， 我 们 观察 下 面 这 段 程序 。 


lw $14, 0x0($0) 11 从 数据 存储 器 的 地 址 9x6 处 加 载 字 ， 保 存 到 通用 寄存 器 
$1 

beq $1, $2, Label // 比较 通用 寄存 器 $1 与 $2， 如 果 相 等 ， 那 么 转移 到 
Label%k 


加 载 指令 lw 会 在 访 存 阶段 从 数据 存储 器 读 取 数 据 ， 也 就 是 在 访 存 阶 
段 才能 获得 要 写 入 通用 寄存 器 $1 的 值 ， 这 个 值 是 $1 的 最 新 值 ， 此 时 紧 接 
着 的 转移 指令 beq 处 于 执行 阶段 ， 而 beq 在 上 一 周期 译 码 阶段 时 ， 就 已 经 
对 寄存 器 $1 与 $2 的 值 进行 了 比较 ， 并 判断 是 否 转移 ， 显 然 这 个 判断 依据 
的 寄存 器 $1 的 值 不 是 lw 指令 加 载 得 到 的 值 ， 所 以 程序 并 没有 按照 意图 运 
行 。 如 图 9-33 所 示 。 


C1) 加 载 指令 lw 在 访 存 阶段 
) 获 得 要 写 入 通用 寄存 器 $1 的 值 


lw $1, 0x0(80) <O EEO 执行 在 < as > 


aa ea aN E 
beq $1, $2, Label KH KC BE KC 执行 >《 访 存 A > 


(3) 而 指令 beq 在 上 一 时 钟 周期 ， 也 就 / 
是 处 于 译 码 阶段 时 ， 就 已 经 比较 了 通用 | 


寄存 器 $1 与 $2 的 值 ， 并 判断 是 否 转移 To 此 时 指令 beq 处 于 执行 阶段 


图 9-33 load 相关 导致 程序 执行 出 错 


即使 通过 数据 前 推 的 方法 ， 将 访 存 阶段 加 载 得 到 的 数据 前 推 ， 也 解 
决 不 了 问题 ， 因 为 数据 加 载 时 ，beq 指 令 已 经 处 于 执行 阶段 了 ， 已 经 进 
行 了 比较 判断 ， 这 种 情况 称 为 load 相 关 。 


9.10.2 ”解决 方法 


OpenMIPS 解 决 load 相 关 的 方法 是 : 在 译 码 阶段 检查 当前 指令 与 上 
一 条 指令 是 否 存在 load 相 关 ， 如 果 存 在 load 相 关 ， 那 么 就 让 流水 线 的 译 
码 、 取 指 阶段 暂停 ， 而 执行 、 访 存 、 回 写 阶段 继续 ， 相 当 于 插入 一 个 空 
旨 令 ， 这 样 处 于 执行 阶段 的 加 载 指 令 会 继续 运行 ， 不 受 影响 ， 当 其 运行 
到 访 存 阶 段 时 ， 将 加 载 得 到 的 数据 前 推 到 译 码 阶段 ， 然 后 ， 流 水 线 可 以 
继续 运行 。 按 照 这 个 方法 执行 上 面 的 示例 程序 ， 流 水 线 会 有 如 图 9-34 所 
示 的 情形 。 


(3) 加 载 指令 lw 在 访 存 阶段 获得 
1 要 写 入 通用 寄存 器 $1 的 值 ， 该 值 
/会 被 推送 到 译 码 阶段 


AN N 
Iw $1, 0x0($0) <  K 十 < 执行 > 
beq $1, $2, Label Gi SE 码 x E x 执行 i IS > 


(1) 在 此 阶段 检测 到 了 load 相 关 ，beq == (2) 此 时 beq 指 令 暂 停 ， 仍 处 于 译 码 阶段 


指令 会 暂停 


图 9-34 ”OpenMIPS 对 load 相 关 的 解决 方法 


其 中 ， 将 访 存 阶段 的 数据 前 推 到 译 码 阶段 ， 这 一 点 我 们 早已 经 
现 ， 所 以 需要 增加 的 就 是 判断 load 相 关 ， 并 在 出 现 load 相 关 时 ， en 
水 线 。 为 了 实现 这 一 新 增 功 能 ， 需 要 对 OpenMIPS 系 统 结 构 做 如 图 9-35 
所 示 的 修改 。 


CTRL 
rst stall 
stallreq_from_id 
= | oe 
Pe hy | 执行 ctrlv 
ID | EX 
stallreq stallreq 
m> ex_aluop_i aluop_o 
| exv 
id.v 


图 9-35 ”修改 OpenMIPS 系 统 结构 以 解决 1oad 相 关 问 题 


将 处 于 执行 阶段 的 指令 的 运算 子 类 型 auop _o、 要 写 的 目的 寄存 器 
地 址 wd_o (未 在 图 9-35 中 画 出 ， 是 因为 在 图 5-8 中 已 经 画 出 ， 此 处 只 男 
新 增 的 接口 ) 等 信息 传递 到 译 码 阶段 的 人 DD 模块 ， 后 者 据 此 判断 是 否 存 
在 load 相 关 ， 如 果 存 在 load 相 关 ， 那 么 通过 stallreq 接 口 通 知 CTRL 模 块 请 
求 流水 线 暂 停 。 其 中 ，ID 模 块 的 stallreq 接 口 在 第 7 章 中 就 已 引入 ， 只 是 
一 直 没 有 使 用 〈 人 参考 7.5.2 节 ) o 


9.11 ”修改 OpenMIPS 以 解决 load 相 
关 问 题 


9.11.1 ”修改 译 码 阶段 的 ID 模块 


参考 图 9-35 可 知 ，ID 模 块 需要 新 增 一 个 接口 ex_aluop_i， 该 接口 的 
首 述 如 表 9-11 所 示 。 


729-11 ID 模块 增加 的 接口 描述 


ID 模块 主要 修改 如 下 ， 完 整 代码 请 读者 参考 本 书 附带 光盘 中 
Code\Chapter9_ 3 目录 下 的 id.v 文 件 。 


module id( 


参考 图 9-35 可 知 ，ID 模 块 的 输出 信号 stallreq 会 送 到 CTRL 模 块 的 接 
口 stallreq_from_id， 其 值 如 果 为 Stop， 表 示 译 码 阶段 请 求 暂停 ， 按 照 在 


7.5 节 设置 的 暂停 机 制 ， 会 使 流水 线 的 取 指 、 译 码 阶段 暂停 ， 而 执行 、 
访 存 、 回 写 阶 段 继续 ， 与 我 们 设想 的 load 相 关 解 决 方法 一 致 。 


9.11.2 ”修改 OpenMIPS 模 块 


为 ID 模块 添加 了 接口 ， 所 以 要 修改 顶层 模块 OpenMIPS ， 以 将 新 
增加 的 接口 按照 图 9-35 所 示 连 接 起 来 。 具 体 修改 代码 不 在 书 中 给 出 ， 读 
者 可 以 参考 本 书 光盘 Code\Chapter9_3 目 录 下 的 openmips.v 文 件 。 


9.12 ”测试 load 相 关 问 题解 决 效果 


通过 如 下 程序 测试 load 相 关 问 题 的 解决 效果 。 源 文件 是 本 书 附带 光 
盘 中 Code\Chapter9_3\AsmTest 目 录 下 的 inst_rom.S 文 件 。 


.org 0x0 

.Set noat 

.set noreorder 

.Set nomacro 

.global _start 
_start: 

ori $1, $0, 0x1234 

sw $1,0x0($0) 


ori $2,$0, 0x1234 
ori $1,$0, 0x0 


# $1 = 0x00001234 
向 数据 存储 器 的 地 址 9x9 处 存储 0x90001234 
[0x0] = 0x00001234 


+ + 


# 设置 寄存 器 $2 = 0x00001234 
# 设置 寄存 器 $1 = 0x00000000 


lw $1,0x0($0) # 从 数据 存储 器 的 地 址 9x9 将 载 数据 处 加 到 寄存 器 $1， 
# 指令 执行 完毕 后 ， 使 得 $1 = 0x00001234 


beq $1,$2, Label # 比较 寄存 器 $1 与 $2， 相 等 ， 转 移 到 Labe1 处 


nop 


ori $1, $0, 0x4567 


nop 


Label: 
ori $1,$0,0x89ab # 设置 寄存 器 $1 = 0x000089ab 


nop 


_loop: 
j _loop 


nop 


如 果 1load 相 关 得 到 正确 解决 ， 那 么 执行 beq 指 令 会 使 程序 发 生 转 
移 ， 转 移 到 Label 处 ， 从 而 不 会 执行 ori $1, $0, 0x4567 这 一 指令 ， 也 就 是 
通用 寄存 器 $1 的 值 不 会 为 0x4567， 而 是 直接 为 0x89ab ，ModelSim 仿真 
结果 如 图 9-36 所 示 ， 观 察 寄 存 器 $1 的 变化 ， 可 知 OpenMIPS 正 确 解决 了 
load 相 关 问 题 。 


® rst sto 
Le ck Sti 
5-4 regfileifregs[1] 000... 


图 9-36 ”ModelSim 仿 真 测试 结果 


913 小结 


本 章 的 内 容 比 较 多 ， 主 要 因为 加 载 存 储 指 令 的 数量 比较 多 ， 而 且 有 
一 些 指 令 在 其 他 指令 集 架构 中 很 少 存在 类 似 指 令 ， 比 如 : IN se Iwlı 
lwr、swr、swl 等 ， 增 加 了 理解 的 难度 ， 为 此 ， 本 章 采 用 分 步骤 的 方式 
实现 加 载 存储 指令 ， 首 先 实 现 了 除 11、sc 指 令 外 的 一 般 加 载 存 储 指令 。 
然后 修改 最 小 SOPC， 为 其 添加 了 数据 存储 器 模块 ， 用 来 验证 一 般 加 载 
存储 指令 是 否 实现 正确 。 接 着 ， 实 现 了 11、sc 指 令 ， 其 中 引入 了 LLbit 寄 
存 器 。 最 后 介绍 了 load 相 关 问 题 ， 并 给 出 了 OpenMIPS 的 解决 方法 。 


第 10 章 ” 协 处 理 器 访问 指令 的 实现 


本 章 首 先 介绍 MIPS32 架 构 中 的 协 处 理 器 ， 说 明了 协 处 理 器 的 作 
用 。 由 于 OpenMIPS 计 划 实 现 其 中 的 一 个 协 处 理 器 -CP0， 所 以 10.2 
节 专 题 介绍 CP0， 然 后 在 10.3 节 实现 协 处 理 器 CP0， 其 实现 方式 有 点 类 
似 H、LO 寄 存 器 的 实现 方式 。10.4 节 说 明 协 处 理 器 访问 指令 mfc0、 
mtc0 的 格式 、 作 用 、 用 法 。10.5 节 给 出 了 协 处 理 器 访问 指令 的 实现 思 
路 ， 以 及 对 系统 结构 的 修改 。10.6 节 通过 修改 OpenMIPS， 实 现 了 协 处 
理 器 访问 指令 ， 最 后 编写 测试 程序 ， 在 ModelSim 中 进行 仿真 验证 。 


10.1 协 处 理 器 介绍 


协 处 理 器 一 词 通常 用 来 表示 处 理 器 的 一 个 可 选 部 件 ， 负 责 处 理 指 
令 集 的 某 个 扩展 ， 具 有 与 处 理 器 核 独立 的 寄存 器 。MIPS32 架 构 提供 了 
最 多 4 个 协 处 理 器 ， 分 别 是 CP0~~CP3， 作 用 如 表 10.1 所 示 。 


表 10.1 MIPS32 架 构 定义 的 协 处 理 器 及 其 作用 


CPO 系统 控制 
CP1 FPU 
CP2 特定 实现 


CP3 FPU 


协 处 理 器 CP0 用 作 系 统 控 制 ，CP1、CP3 用 作 浮 点 处 理 单 元 ， 而 
CP2 被 保留 用 于 特定 实现 。 除 CP0 外 的 协 处 理 器 都 是 可 选 的 ， 
OpenMIPS 没 有 实现 浮 点 运算 ， 所 以 CP1、CP3 不 用 实现 ，CP2 也 没有 
作用 ， 不 用 实现 。 而 CP0 是 不 可 选 的 ， 需 要 实现 ， 所 以 下 面 重 点 介绍 
协 处 理 器 CP0。 


截至 本 章 ， 我 们 的 OpenMIPS 处 理 器 实现 了 很 多 指令 ， 但 这 些 指令 
都 是 用 来 运算 的 ， 实 际 的 处 理 器 还 要 支持 其 他 广泛 的 操作 ， 例 如 : 中 
断 处 理 、 提 供 可 选 的 配置 、 观 察 并 控制 系统 缓存 或 时 钟 、 地 址 转换 
等 。MIPS32 架 构 定义 的 协 处 理 器 CP0 的 作用 就 是 协助 实现 上 述 的 广泛 
操作 。CP0 负 责 的 主要 工作 如 下 。 


10.2 


配置 CPU 工作 状态 : 符合 MIPS32 架 构 的 硬件 通常 是 很 灵活 
的 ， 可 以 通过 读 / 写 一 个 或 一 些 内 部 寄存 器 来 改变 一 些 很 根本 
的 CPU 特性 (80: 将 字 节 次 序 从 MSB 变 为 LSB， 或 者 从 LSB 
DAMSB) o 

高 速 缓存 控制 : 符合 MIPS32 架 构 的 CPU 一 般 会 集成 缓存 控制 
器 ， 用 来 控制 、 读 、 写 缓存 。 

异常 控制 异常 发 生 时 的 检测 和 处 理 都 由 CP0 中 的 一 些 控制 
寄存 器 来 定义 和 控制 。 

存储 管理 单元 控制 : 对 系统 的 存储 区 域 进行 合理 的 控制 、 管 
理 和 分 配 ， 主 要 是 对 MMU、TLB 的 一 些 配置 、 管 理 、 访 问 。 
其 他 : 当 要 把 额外 的 功能 集成 在 CPU 中 ， 但 又 不 方便 当 作 外 
设 访问 时 ， 常 常 在 CP0 中 增加 一 些 模块 以 实现 这 些 功 能 。 例 
如 : 时 钟 、 时 间 计 数 器 、 奇 偶 校 验 错误 检测 等 。 


协 处 理 器 CP0 中 的 寄存 器 


CP0 中 有 一 系列 寄存 器 用 来 完成 上 述 工 作 。 如 表 10-2 所 示 。 


表 10-2 ”CP0 中 的 寄存 器 描述 


标 号 di 功能 描述 


À un 
ndex 
andom 
rd 
偶数 虚拟 页 的 入 
2 EntryLo0 口 地 址 的 低位 部 
分 这 些 都 是 
与 内 存 管 
奇数 虚拟 页 的 入 ”| EMMU, 
3 EntryLol 口 地 址 的 低位 部 地 址 翻译 
分 快 表 TLB 
BRN 
指向 内 存 虚拟 页 存 器 
4 Context 表 入 口 地 址 的 指 


针 


TLB 入 口中 可 


控制 固定 的 TLB 入 


Wired 
口 的 数目 


记录 最 近 一 次 地 
BadVAddr 址 相关 异常 的 地 
址 


与 内 存 管 
理 MMU、 
TLB 入 口 地 址 的 高 || 地 址 翻译 
ntryHi 
位 部 分 快 表 TLB 
BANDS 
172% 


CO ome E | 


处 理 器 状态 和 控 
制 寄存 器 ， 包 括 
Status 决定 CPU 特权 等 
级 ， 使 能 哪些 中 
_ im 
ome 
保存 上 一 次 异常 
时 的 程序 计数 器 
ae iaa 
A 


配置 寄存 器 ， 用 
16 Config 来 设置 CPU 的 参 
数 
加 载 链接 指令 
LLAddr 加 载 的 数据 存储 
eo meo Am | 
= 与 调试 有 


2022 | 22 


wer 与 调试 有 
tia 


T 控制 Cache 指 令 与 Cache 有 
u = 
28 TagLo/DataLo Cache 中 Tag 接 口 a ey 与 Cache 有 


| | 的 低位 部 分 | 


COC a 


ErrorEPC 


neue 用 于 调试 处 理 的 。 | 与 调试 有 
暂停 寄存 器 关 


eee oe MMU, TLB, W8 
关 的 ， 而 OpenMIPS 的 设计 目标 是 一 个 轻 量 级 的 处 理 器 ， 并 不 打算 实现 
缓存 、MMU、TLB、 no 所 以 相关 的 寄存 器 都 可 以 不 用 
实现 ， 本 书 也 不 再 介绍 这 些 寄存 器 ， 读 者 只 需 注意 表 中 使 用 加 粗 、 斜 
体 标 注 的 7 个 寄存 器 即 可 ， 下 面 依次 介绍 这 7 个 寄存 器 的 格式 、 作 用 。 


1。Count 寄 存 器 (标号 为 9) 


Count 寄 存 器 是 一 个 不 停 计 数 的 32 位 寄存 器 ， 计 数 频率 一 般 与 CPU 
时 钟 频率 相同 ， 当 计数 达到 32 位 无 符号 数 的 上 限时 ， 会 从 0 开始 重新 计 
数 。Count 寄 存 器 可 读 、 可 写 。 其 字段 如 表 10-3 所 示 。 


表 10-3 ”Count 寄存 器 的 字段 


2。Compare 寄 存 器 〈 标 号 为 11) 


Compare 寄 存 器 是 一 个 32 位 的 寄存 器 ， 与 Count 寄 存 器 一 起 完成 定 
时 中 断 功 能 。 当 Count 寄 存 器 中 的 计数 值 与 Compare 寄 存 器 中 的 值 一 样 
时 ， 会 产生 定时 中 断 。 这 个 中 断 会 一 直 保 持 ， 直 到 有 数据 被 写 入 
Compare 寄 存 器 。Compare 寄 存 器 可 读 、 可 写 。 其 字段 如 表 10-4 所 示 。 


表 10-4 Compare 寄 存 器 的 字段 


Bit 31-0 


3。Status 寄 存 器 (标号 为 12) 


Status 寄 存 器 也 是 一 个 32 位 、 可 读 、 可 写 的 寄存 器 ， 用 来 控制 处 理 
器 的 操作 模式 、 中 断 使 能 以 及 诊断 状态 。 其 字段 如 表 10-5 所 示 。 


7210-5 Status 寄存 器 的 各 个 字段 


IF |. > > im 
6 |m un je e 


表 10-5 中 标识 为 R 的 字段 是 保留 了 字段， 下 面 逐 一 介绍 其 中 的 非 保留 
字段 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字 
段 ， OpenMIPS 处 理 器 也 只 实现 了 这 些 字 段 。 


e CU3-CU0 


表示 协 处 理 器 是 否 可 用 (Coprocessor Usability) ， 分 别 控制 协 处 
理 器 CP3、CP2、CP1、CP0。 为 0 时 ， 表 示 相 应 的 协 处 理 器 不 可 用 ; 为 


1 时 ， 表 示 相 应 的 协 处 理 器 可 用 。 对 于 OpenMIPS 处 理 器 而 言 ， 只 有 协 
处 理 器 CP0， 所 以 可 以 设置 本 字段 为 4b0001。 


e RP 


表示 是 否 启用 低 功 耗 模式 (Reduced Power) ， 但 是 否 实现 以 及 如 
何 实现 是 同 具 体 处 理 器 相关 的 ， 比 如 : 有 的 处 理 器 可 以 通过 降低 工作 
频率 、 工 作 电 压 ， 来 实现 低 功 耗 ，OpenMIPS 处 理 器 没有 实现 这 些 功 
能 ， 所 以 本 字段 并 没有 作用 。 


e RE 


用 来 改变 用 户 态 模式 下 的 字 节 次 序 ，1 表 示 改 变 ，0 表 示 不 改变 ， 
MIPS 处 理 器 可 以 在 复位 的 时 候 配 置 工作 在 大 端 模 式 (MSB) 还 是 小 端 
模式 (LSB) ， 工 作 在 用 户 态 模式 下 的 软件 可 以 通过 设置 此 处 的 RE 字 
段 ， 改 变 大 小 端 模式 。OpenMIPS 处 理 器 没有 实现 此 项 功能 ， 固 定 工作 
在 大 端 模式 ， 所 以 本 字段 并 没有 作用 。 


e BEV 


表示 是 否 使 用 启动 异常 向 量 (Bootstrap Exception Vector) ， 为 0 
表示 使 用 一 般 异 常 向 量 ， 为 1 表示 使 用 启动 异常 向 量 ， 主 要 区 别 是 : 局 
动 异 常 向 量 对 应 的 异常 处 理 例 程 入 口 地 址 位 于 不 能 被 缓存 、 不 能 被 
MMU 了 映射 的 内 存 空间 。 在 系统 刚刚 启动 的 时 候 ， 缓 存 、MMU 都 没有 
准备 好 ， 此 时 只 能 使 用 启动 异常 向 量 ， 否 则 可 能 会 出 错 。 对 OpenMIPS 
处 理 器 而 言 ， 没 有 缓存 、 也 没有 MMU ， 采 用 的 异常 处 理 机 制 也 相对 简 
化 了 许多 〈 在 第 11 章 会 详 述 ) ， 所 以 本 字段 并 没有 作用 。 


e TS 


表示 是 否 关 闭 TLB (TLB Shutdown) ， 为 1 表示 关闭 TLB， 为 0 表 
示 打 开 TLB。OpenMIPS 处 理 器 没有 实现 TLB， 所 以 本 字段 并 没有 作 


表示 是 否 是 软 重启 (Soft Reset) ， 为 1 表示 重启 异常 是 由 软 重启 


e NMI 


表示 是 否 是 不 可 屏 贡 中 断 (Non-Maskable Interrupt) ， 为 1 表示 重 
启 异 常 是 由 不 可 屏 数 中 断 引起 的 。 


e IM7-IMO 


表示 是 否 屏蔽 相应 中 断 (Interrupt Mask) ，0 表 示 屏 珊 ，1 表 示 不 
屏蔽 ，MIPS 处 理 器 可 以 有 8 个 中 断 源 ， 对 应 IM 字 段 的 8 位 ， 其 中 6 个 中 
断 源 是 处 理 器 外 部 硬件 中 断 ， 另 外 2 个 是 软件 中 断 ， 中 断 是 否 能 够 被 处 
理 器 响应 是 由 Status 寄 存 器 与 Cause 寄 存 器 共同 决定 的 ， 如 果 Status 寄 存 
器 的 IM 字 段 与 Cause 寄 存 器 的 IP 字 段 的 相应 位 都 为 1， 而 且 Status 寄 存 器 
的 正字 段 也 为 1 时 ， 处 理 器 才 响应 相应 中 断 。 


e UM 


表示 是 否 为 用 户 模式 (User Mode) ， 为 1 表示 处 理 器 运行 在 内 核 
模式 ， 为 0 表示 处 理 器 运行 在 用 户 模 式 。OpenMIPS 处 理 器 在 实现 的 时 
候 并 没有 区 分 内 核 模 式 、 用 户 模 式 ， 两 种 模式 下 的 权限 是 一 样 的 ， 都 
可 以 访问 处 理 器 的 所 有 资源 ， 所 以 本 字段 并 没有 作用 。 


e ERL 


表示 是 否 处 于 错误 级 ， 当 处 理 器 接收 到 坏 的 数据 时 设置 本 字段 为 
1。 有 一 些 MIPS 处 理 器 在 接收 来 自 缓 存 或 内 存 中 的 数据 块 时 ， 能 够 检 
验 数据 中 附 膏 的 奇偶 核验 位 或 纠 错 码 ， 当 发 现 数据 错误 且 无 法 纠正 
时 ， 处 理 器 就 设置 ERL 字 段 为 1， 并 进入 奇偶 校 验 \ECC 错 误 的 异常 处 
理 过 程 ， 这 是 一 个 特殊 的 异常 处 理 过 程 (有 别 于 一 般 的 异常 处 理 过 
程 ) 。 读 者 只 需 知 道 ，OpenMIPS 处 理 器 没有 对 奇偶 校 验 位 或 纠 错 码 的 
检验 过 程 ， 所 以 不 用 考虑 ERL 字 段 。 


e EXL 


表示 是 否 处 于 异常 级 (Exception Level) ， 当 异常 发 生 时 ， 会 设 
置 本 字段 为 1， 表 示 处 理 器 处 于 异常 级 ， 此 时 ， 处 理 器 会 进入 内 核 模 式 
下 工作 ， 并 且 禁 止 中 断 。 


。 IE 


表示 是 否 使 能 中 断 (Interrupt Enable) ， 这 是 全 局 中 断 使 能 标志 
位 。 为 1 表示 中 断 使 能 ， 为 0 表示 中 断 禁止 。 


4. Cause AFA (标号 为 13) 


Cause 寄 存 器 主要 记录 最 近 一 次 异常 发 生 的 原因 ， 也 控制 软件 中 断 
请 求 。Cause 寄 存 器 的 各 字段 如 表 10-6 所 示 ， 除 了 IP[1:0]、IV 和 WP， 
其 余 字 段 都 是 只 读 的 。 


表 10-6 Cause 寄存 器 的 各 个 字段 


3 27 26 25-24 23 22 21-16 
DC PCI 0 IV WP 0 
15-10 9-8 7 6-2 1-0 
0 xcCode 


ma ë [o p þe | 


表 10-6 中 标识 为 R 的 字段 是 保留 字段 ， 下 面 逐 一 介绍 其 中 的 非 保 留 
字段 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字 
段 ，OpenMIPS 处 理 器 也 只 实现 了 这 些 字段 。 


e BD 


当 发 生 异 常 的 指令 处 于 分 支 延迟 槽 (Branch DelaySlot) 时 ， 该 字 
段 被 置 为 1。 


e CE 


当 协 处 理 器 不 可 用 异常 发 生 时 ,将 发 生 协 处 理 器 错误 
(Coprocessor Error) 的 协 处 理 器 序号 存储 到 本 字段 。 


e DC 


这 是 在 MIPS32/64 架 构 中 新 增加 的 字段 ， 将 其 置 为 1， 可 以 使 
Count 寄 存 器 停止 计数 ， 这 样 做 的 目的 之 一 是 减少 功 耗 。 


e PCI 


这 是 在 MIPS32/64 架 构 中 新 增加 的 字段 ， 当 协 处 理 器 CP0 的 性 能 计 
数 器 溢出 时 (Performance Count Interrupt) ， 设 置 本 字段 为 1， 以 产生 
中 断 。 


e IV 


中 断 向 量 (Interrupt Vector) 的 选择 与 此 字段 有 关 ， 将 该 字段 置 为 
0 表示 使 用 一 般 中 断 向 量 ， 反 之 ， 表 示 使 用 特殊 中 断 向 量 。OpenMIPS 
处 理 器 通过 一 种 简单 的 异常 向 量 表 的 方式 来 处 理 中 断 (在 第 11 章 会 有 
详 述 ， 所 以 这 个 字段 没有 作用 。 


e WP 


观测 挂 起 (Watch Pending) 字段 ， 该 字段 与 调试 有 关 ， 为 1 表示 
有 一 个 观测 点 被 触发 ， 处 理 器 处 于 异 单 模式 。 


e IP[7:2] 


中 断 挂 起 (Interrupt Pending) 字段 ， 相 应 位 用 来 指明 外 部 硬件 中 
断 是 否 发 生 ，1 表 示 发 生 ，0 表 示 没 有 发 生 。 本 字段 的 6 位 与 外 部 硬件 中 
断 的 对 应 关系 如 下 。 


IP[7] 一 一 5 号 硬件 中 断 

IP[6] 一 一 4 号 硬件 中 断 

IP[5] 一 一 3 号 硬件 中 断 

IP[4] 一 一 2 号 硬件 中 断 

IP[3] 一 一 1 号 硬件 中 断 

IP[2] 一 一 0 号 硬件 中 断 
e IP[1:0] 


也 是 中 断 挂 起 字段 ， 但 是 对 应 的 是 软件 中 断 。 


IP[1] 一 一 1 号 软件 中 断 
IP[0] 一 一 0 号 软件 中 断 
e ExcCode 


本 字段 是 一 个 5 位 的 编码 ， 用 来 记录 发 生 了 哪 种 异常 ，ExcCode 编 
码 的 含义 如 表 10-7 所 示 。 其 中 很 多 与 MMU、 Cache、TLB 等 模块 有 
关 ， 而 我 们 的 OpenMIPS 处 理 器 并 没有 实现 这 些 模块 ， 所 以 相应 的 异常 
也 不 用 考虑 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 
的 ExcCode 编 码 ，OpenMIPS 只 实现 了 对 这 几 种 异常 的 处 理 ， 所 以 也 只 
使 用 这 些 编 码 。 


表 10-7 ExcCode 的 编码 及 其 含义 


ES 


mn i 
CN 


BS 忌 线 错误 异常 


AAA AAA AAA) 


加 载 或 存储 数据 过 程 中 ， 总 线 错误 异 
单 
一 
fe lw | 
执行 未 定义 指令 引起 的 异常 
Ce C CT 
ee 


机 器 检测 ，CPU 检 测 到 CPU 控制 系统 中 
MCheck = BE 
的 灾难 性 错误 


5。EPC 寄 存 器 (标号 为 14) 


EPC 是 异常 程序 计数 器 (Exception Program Counter) ， 用 来 存储 
异常 运 回 地 址 ， 一 般 情况 下 ， 和 存储 发 生 异 常 的 措 令 的 地 址 ， 但 是 ， 如 
果 发 生 异常 的 指令 位 于 延迟 槽 中 ， 那 么 EPC 存 储 的 是 前 一 条 转移 指令 
的 地 址 。 该 寄存 器 可 读 、 可 写 。 其 字段 如 表 10-8 所 示 。 


7210-8 EPC 寄 存 器 的 字段 


6。PRId 寄 存 器 (标号 为 15) 


PRId 寄 存 器 是 处 理 器 标志 (Processor Identifier) 寄存 器 ， 包 含 的 
信息 有 : 制造 商 信息 、 处 理 器 类 型 以 及 处 理 器 的 版 本 等 。 各 个 字段 如 
表 10-9 所 示 。 其 中 R 是 保留 字段 。 


表 10-9 PRId 寄 存 器 的 各 个 字段 


各 个 字段 的 含 = 义 如 下 。 


e Company ID 
趾 明 设计 或 生产 该 处 理 器 的 公司 。 
e Processor ID 


指明 处 理 器 的 类 型 ， 软 件 可 以 依据 这 个 字段 来 区 分 不 同类 型 的 
MIPS 处 理 器 。 


e Revision 


利明 处 理 器 的 版 本 号 ， 软 件 可 以 依据 这 个 字段 来 区 分 同类 型 处 理 
器 的 不 同 版 本 。 


7. Config 寄 存 器 (标号 为 16) 


Config 寄 存 器 包含 了 与 处 理 器 有 关 的 各 种 配置 和 功能 信息 ， 其 各 
个 字段 如 表 10-10 所 示 ， 大 部 分 字段 由 硬件 在 重启 时 进行 初始 化 ， 或 定 
Alm Bo 


3210-10 ”Config 寄存 器 的 各 个 字段 


= EEE 


各 个 字段 的 含义 如 下 。 有 一 些 字段 是 与 MMU、TLB、Cache 等 模 
块 有 关 ， 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 中 使 用 灰色 背景 的 字 
段 。 


e M 


表示 是 否 存 在 Config1 寄 存 器 ，MIPS32 架 构 中 实际 定义 了 4 个 配置 
寄存 器 : Config、Config1-3，OpenMIPS 处 理 器 只 实现 了 Config 寄 存 
器 ， 所 以 OpenMIPS 在 初始 化 的 时 候 需 要 设置 本 字段 为 0， 表 示 没 有 
Config1 寄 存 器 。 


e Impl 


这 是 与 实现 相关 的 配置 标记 ，MIPS32 架构 的 处 理 器 会 在 本 字段 
设置 一 些 自 定 义 的 信息 ，OpenMIPS 处 理 器 没有 使 用 本 字段 。 


。 BE 


其 值 为 1 表示 处 理 器 工作 在 大 端 模式 (MSB) ， 为 0 表示 处 理 器 工 
作 在 小 端 模式 (LSB) 。OpenMIPS 处 理 器 工作 在 大 端 模 式 ， 所 以 设置 
本 字段 为 1。 


e AT 


指令 集 架 构 类 型 (Architecture Type) 字段 ， 当 其 值 为 2b00 时 ， 表 
示 MIPS32 架 构 。 


e AR 


指令 集 架 构 发 行 版 本 (Architecture Revision) 字段 ， 当 其 值 为 
3b000 时 ， 表 示 MIPS32/64 架 构 的 发 行 版 1， 当 其 值 为 3b001 时 ， 表 示 
MIPS32/64 架 构 的 发 行 版 2。 


e MT 


MMU 类 型 字段 ， 当 其 值 为 3b000 时 ， 表 示 没 有 MMU。OpenMIPS 
处 理 器 没有 实现 MMU， 所 以 本 字段 固定 为 3b000。 


e VI 


如 果 一 级 指令 缓存 是 使 用 虚拟 程序 地 址 索引 做 标签 ， 那 么 就 设置 
本 字段 为 1。OpenMIPS 处 理 器 没有 实现 缓存 ， 所 以 本 字段 国定 为 0。 


e KO 


表示 内 存 的 Kseg0 区 域 是 否 可 缓存 ， 其 中 Kseg0 是 内 存 中 的 一 段 空 
以 本 字段 固定 为 3b000。 


以 上 就 是 协 处 理 器 CP0 中 的 主要 寄存 器 ， 也 是 实现 OpenMIPS 处 理 
器 的 CP0 中 的 寄存 器 ， 读 者 可 能 会 有 疑问 ， 在 之 前 的 介绍 中 提 到 CP0 是 
用 来 系统 控制 的 ， 但 是 截止 到 现在 似乎 只 是 介绍 了 CP0 中 的 寄存 器 ， 
那么 CP0 是 如 何 实现 系统 控制 功能 的 呢 ? 其 实 ，CP0 的 控制 功能 就 是 通 
过 上 面 介绍 的 寄存 器 实现 的 ， 比 如 : 状态 寄存 器 Status 中 的 中 断 掩 码 字 
段 IM， 处 理 器 要 依据 该 字段 处 理发 生 的 中 断 ， 通 过 修改 这 个 字段 ， 就 
可 以 控制 哪些 中 断 处理 ， 哪 些 中 断 不 处 理 ， 这 就 体现 了 CP0 的 控制 功 
能 。 中 断 处 理 的 详细 过 程 ， 会 在 第 11 章 介绍 。 


10.3” 协 处 理 器 CP0 的 实现 


要 实现 协 处 理 器 访问 指令 ， 首 先 要 实现 协 处 理 器 CP0， 其 实现 方 
式 类 似 于 第 6 章 中 HI、LO 寄 存 器 的 实现 方式 。CP0 的 接口 如 图 10-1 所 
示 。 这 里 采用 左边 是 输入 接口 ， 右 边 是 输出 接口 的 方式 绘制 ， 这 样 比 
较 直 观 ， 便 于 理解 。 各 接口 的 描述 如 表 10-11 所 示 。 


CP0 

— wei data_o | 一 一 

—— waddr i 
—— data i count_0 — 
compare_o}—— 
— int i status 0 — 
cause 0, 一 
—— raddr_i epc_o}——— 
config_o-—— 
——18t prid_op—— 
—— clk timer_int_o}+—— 

cp0_reg.v 


10-1 协 处 理 器 CP0 的 接口 


7210-11 协 处 理 器 CP0 的 接口 描述 


要 读 取 的 CPO 中 寄存 器 的 地 址 
个 外 部 便 人 dl Hi 折 输 入 


输出 


输出 


TT BETS CPO 中 的 寄存 器 
要 写 的 CPO 中 寄存 器 的 地 址 


EPC 寄存 器 的 值 


Config 寄存 器 的 值 


协 处 理 嚣 CP0 的 实现 代码 如 下 ， 源 文件 是 本 书 附带 光盘 


输出 


A 


输出 


PRId 寄存 器 的 值 
是 否 有 定时 中 断 发 生 


Code\Chapter10 目 录 下 的 cp0_reg.v 文 件 。 


module cp0_reg( 


input 


input 


input 
input 
input 


input 


wire clk, 
wire rst, 

wire 

wire[4:0] 

wire[4:0] 


wire[ 'RegBus] 


we_i, 
waddr_i, 
raddr_i, 


data_i, 


“define CPO_REG_CAUSE 5'b01101 


“define CPO_REG_EPC 5'b01110 
“define CPO_REG_PRId 5'bo1111 
“define CPO_REG_CONFIG 5'b10000 


“define InterruptAssert 1'b1 


“define InterruptNotAssert 1'b0 


上 述 代 码 可 以 分 为 两 段 理 解 ， 第 一 段 实 现 了 对 CP0 中 寄存 器 的 写 
操作 ， 依 据 写 入 地 址 ， 将 输入 数据 保存 到 不 同 的 寄存 器 中 ， 这 是 一 个 
时 序 逻 辑 ， 第 二 段 实 现 了 对 CP0 中 寄存 器 的 读 操作 ， 依 据 读 取 地 址 ， 
将 相应 寄存 器 的 值 通过 data_o 接 口 输出 ， 这 是 一 个 组 合 逻 辑 。 注 意 以 
Flo 


(1) OpenMIPS R 5 Hi Y CPOP AY Count, Compare, Status, 
Cause, EPC, PRId, Config 7 个 寄存 器 。 


(2) 这 7 个 寄存 器 中 的 PRId、Config 不 可 以 写 ， 所 以 在 第 一 段 代 
码 中 没有 写 入 这 两 个 寄存 器 的 代码 。 此 外 ，Cause 寄 存 器 只 有 其 中 的 
IP[1:0]、IV、WP 三 个 字段 可 写 ， 所 以 对 Cause 寄 存 器 的 写 入 是 选择 性 
的 。 


(3) Count 寄 存 器 的 值 在 每 个 时 钟 周期 都 会 加 1。 


(4) 当 Compare 寄 存 器 不 为 0， 且 Count 寄 存 器 的 值 等 于 Compare 
寄存 器 的 值 时 ， 将 输出 信号 timer_int_o 置 为 1， 表 示 时 钟 中 断 发 生 ， 这 
个 中 断 会 一 直 声 明 ， 直 到 有 数据 写 入 Compare 寄 存 器 。 


(5) 当 写 Compare 寄 存 器 的 时 候 ， 会 将 输出 信号 timer_int_o 置 为 
0， 表 示 取 消 时 钟 中 断 的 声明 。 


(6) MIPS32 架 构 支 持 8 个 中 断 ， 但 是 有 2 个 是 软件 中 断 ， 支 持 的 
外 部 硬件 中 断 只 有 6 个 ， 所 以 CP0 模 块 的 中 断 输 入 信号 int_i 的 宽度 是 
60 


(7) Cause$7233#9 #10 15bitEIP[7:2]), BORA AUF 
挂 起 字段 ， 指 明 外 部 硬件 中 断 是 否 挂 起 ， 所 以 代码 中 直接 将 外 部 中 断 
输入 int_j 赋 给 Cause 寄 存 器 的 第 10 人 15bit。 


(8) CP0 中 寄存 器 的 地 址 与 表 10-2 中 的 标号 是 一 致 的 。 


10.4” 协 处 理 器 访问 指令 说 明 


要 实现 CP0 的 控制 功能 ， 需 要 对 CP0 中 的 有 关 寄 存 器 进行 设置 ， 这 
涉及 对 CP0 中 寄存 器 的 访问 ， 需 要 使 用 协 处 理 器 访问 指令 。MIPS32 指 
令 集 架构 中 定义 了 2 条 协 处 理 器 访问 指令 : mtc0、mfc0， 前 者 实现 修 
改 CP0 中 的 寄存 器 ， 后 者 实现 读 取 CP0 中 的 寄存 器 。 指 令 格 式 如 图 10-2 
所 示 。 


31 26 25 21 20 16 15 11 10 3" 2 0 


COP0 MT rn 
010000 | 00100 a nt 00000000 sel | mtc0 指 令 
COP0 MF = 
010000 | 00000 a rd 00000000 sel | mfc0 指 令 


10-2 mtc0、mfc0 指 令 格 式 


从 图 10-2 中 可 以 发 现 ， 这 2 条 指令 的 格式 与 之 前 已 实现 的 指令 都 不 
同 ， 主 要 特点 是 : 指令 码 都 为 6b010000，MIPS32 指 令 集 架构 定义 为 


COP0 类 ， 需 要 借助 于 第 21~25bit 的 值 才 能 确定 具体 是 哪 一 条 指令 。 此 
外 ， 指 令 的 第 3 一 10bit 为 0， 第 0 一 2bit 是 sel] 域 ， 这 个 域 的 作用 取决 于 有 具 
体 的 MIPS32 架 构 处 理 器 ， 对 OpenMIPS 处 理 器 而 言 ，sel 域 没有 作用 ， 
不 用 考虑 。 下 面 分 别 说 明 mtc0、mfc0 两 条 指令 的 用 法 、 作 用 。 


。 当 指 令 码 是 6b010000， 且 第 21~~25bit 的 值 为 5"'b00100 时 ， 是 


mtc0 指 令 。 
指令 用 法 为 : mtc0 rt, rdo 


指令 作用 为 : CPR[0, rd] <- GPR[rt]， 将 地 址 为 rt 的 通用 寄存 器 的 
值 赋 给 协 处 理 器 CP0 中 地 址 为 rd 的 寄存 器 。 


. 当 指 令 码 是 6b010000， 且 第 21~25bit 的 值 为 5'b00000 时 ， 是 


mfc0 指 令 。 
指令 用 法 为 : mfc0 rt, rdo 


指令 作用 为 : GPRIrt] <- CPR[0, rd]， 读 出 协 处 理 器 CP0 中 地 址 为 
rd 的 寄存 器 的 值 ， 并 赋 给 地 址 为 rt 的 通用 寄存 器 。 


10.5” 协 处 理 器 访问 指令 实现 思路 
10.5.1 ”实现 思路 


与 对 HI、LO 寄 存 器 的 访问 一 样 ， 对 CP0 中 所 有 寄存 器 的 写 操 作 也 
都 放 在 回 写 阶 段 。 


1。mtc0 实 现 思路 
(1) 在 译 码 阶段 依据 指令 ， 读 出 地 址 为 rt 的 通用 寄存 器 的 值 。 


(2) 在 执行 阶段 确定 要 写 入 CP0 中 寄存 器 的 值 ， 其 实 就 是 译 码 阶 
段 读 出 的 地 址 为 rt 的 通用 寄存 器 的 值 ， 将 这 些 信 息 传 递 到 访 存 阶段 。 


(3) 访 存 阶段 再 将 这 些 信息 传递 到 回 写 阶段 。 
(4) 回 写 阶段 依据 这 些 信息 修改 CP0 中 的 地 址 为 rd 的 寄存 器 。 
2。mfc0 实 现 思 路 


(1) 在 执行 阶段 获取 CP0 中 指定 寄存 器 的 值 ， 作 为 要 写 入 目的 通 
用 寄存 器 的 数据 ， 并 将 这 些 信息 传递 到 访 存 阶段 。 


(2) 访 存 阶段 再 将 这 些 信 息 传 递 到 回 写 阶段 。 


(3) 回 写 阶段 依据 这 些 信息 修改 地 址 为 rt 的 通用 寄存 器 。 


10.5.2 ”数据 流 图 的 修改 


添加 协 处 理 器 CP0 后 的 数据 流 图 如 图 10-3 所 示 。 相 比 图 9-29， 在 回 
写 阶 段 增加 了 CP0 模 块 ， 并 且 CP0 模 块 的 输出 数据 传递 到 执行 阶段 ， 用 
于 确定 最 后 参与 运算 的 操作 数 。 比 如 : mfc0 指 令 在 执行 阶段 就 会 选择 
从 CP0 传 递 过 来 的 数据 ， 作 为 运算 结果 ， 写 入 目的 寄存 器 。 


ate |) | U 时 
‘it | zs N f 
ES 
i | a A it! 
Fan | 1 1 | 存储 器 Ba 
| =, No i | 


执行 vite yg HS, 


图 10-3 ”添加 协 处 理 器 CP0 后 的 数据 流 图 


10.5.3 ”系统 结构 的 修改 


为 了 实现 对 协 处 理 器 CP0 的 访问 指令 mtc0、mfc0， 需 要 对 系统 结 
构 进 行 如 图 10-4 所 示 的 修改 。 从 图 中 观察 ， 似 乎 增加 了 不 少 接口 ， 但 
实际 上 很 好 理解 。 


如 果 是 读 取 CP0 中 寄存 器 的 指令 mfc0， 那 么 在 执行 阶段 的 EX 模块 
会 通过 接口 op0_reg_read_addr_o 输 出 要 读 取 的 CP0 中 寄存 器 的 地 址 ， 该 
接口 直接 与 CP0 模 块 相 连 ， 正 是 图 10-4 中 加 粗 的 连接 线 。CP0 模 块 通过 
data_ 0 接口 送出 相应 的 数据 ， 送 出 的 数据 通过 EX 模块 的 接口 
cp0_reg_data_ i 进入 EX 模块 ， 正 是 图 10-4 中 加 粗 的 虚线 。 


图 10-4 “为 实现 协 处 理 器 访问 指令 而 对 系统 结构 做 的 修改 


如 果 是 修改 CP0 中 寄存 器 的 指令 mtc0， 那 么 会 在 执行 阶段 的 EX 模 
块 通过 接口 cp0_reg_we_o 送 出 写 信 号 ， 通 过 接口 cp0_reg_write_addr_o 
送出 要 写 的 CP0 中 寄存 器 的 地 址 ， 通 过 接口 cp0_reg_data_o 送 出 要 写 入 
的 值 ， 这 些 信息 最 终 都 传递 到 回 写 阶段 ， 分 别 送 入 CP0 模 块 的 接口 
we_i、waddr i、data i， 从 而 达到 修改 CP0 中 指定 寄存 器 的 目的 。 


需要 特别 说 明 一 点 ， 对 于 读 取 CP0 中 寄存 器 的 指令 mfc0，EX 模 块 
从 CP0 模 块 中 读 取 的 值 可 能 不 是 最 新 的 值 ， 因 为 此 时 处 于 流水 线 访 
存 、 回 写 阶 段 的 指令 可 能 是 mtc0， 也 就 是 说 可 能 会 修改 CP0 中 的 寄存 
器 ， 读 者 朋友 读 到 这 里 应 该 会 心 一 笑 ， 是 的 ， 这 个 问题 ， 在 第 4 章 考虑 
流水 线 相关 的 时 候 遇 到 过 ， 在 第 6 章 读 / 写 HI、LO 寄 存 器 的 时 候 遇 到 
过 ， 在 第 9 章 读 / 写 LLbit 寄 存 器 的 时 候 也 遇 到 过 ， 解 决 方法 都 是 一 样 的 
数据 前 推 ， 此 处 也 不 例外 ， 将 访 存 、 回 写 阶段 对 CP0 中 寄存 器 的 
与 信息 前 推 到 执行 阶段 的 EX 模块 ， 由 EX 模块 判断 得 到 最 新 的 值 。 这 
也 就 是 图 10-4 中 ，MEM 模 块 、MEM/WB 模 块 的 输出 会 回 送 到 EX 模块 
的 原因 。 


此 外 ， 图 10-4 中 ，CP0 模 块 的 各 个 寄存 器 输出 接口 暂时 没有 使 
用 ， 在 第 11 章 实现 异常 处 理 的 时 候 会 使 用 到 。 


还 需要 注意 的 是 ， 图 10-4 中 ，CP0 模 块 的 输入 int_i 是 OpenMIPS 处 
理 器 的 输入 ，CP0 模 块 的 输出 timer_int_o 是 OpenMIPS 处 理 器 的 输出 。 
由 此 ， 得 到 添加 协 处 理 器 CP0 后 的 OpenMIPS 处 理 器 接口 示意 图 如 图 
10-5 所 示 。 增 加 的 接口 如 表 10-12 所 示 。 


OpenMIPS 
timer_int_o —— 
rst rom_ce o — 
clk rom_addr 0 — 
rom_data i ram addr o — 
ram_data_i ram data o — 
mt ram_sel_o —— 
ram_we_o — 
ram_ce o — 

openmips, v 


图 10-5 添加 协 处 理 器 CP0 后 的 OpenMIPS 处 理 器 接口 


7210-12 ”OpenMIPS 处 理 器 新 增加 接口 的 描述 


宽度 (bit) 输入 /输出 作用 


10.6 ”修改 OpenMIPS 以 实现 协 处 
理 器 访问 指令 


10.6.1 ”修改 译 码 阶段 


译 码 阶段 需要 修改 ID 模 块 ， 在 其 中 添加 对 mtc0、mfc0 指 令 的 译 
码 。 主 要 修改 的 代码 如 下 所 示 ， 完 整 代码 请 参考 本 书 附带 光盘 
Code\Chapter10 目 录 下 的 id.v 文 件 。 


从 图 10-2 中 可 以 发 现 这 2 条 指令 的 格式 与 之 前 已 实现 的 指令 都 不 
同 ， 单 独 依据 指令 码 无 法 区 分 这 2 条 指令 ， 所 以 此 处 直接 通过 指令 第 21 
一 31bit 的 值 判断 区 分 mfc0、mtc0 指 令 ， 另 外 ， 从 图 10-2 中 还 可 知 ， 这 2 
条 指令 要 求 第 0 一 10bit 都 为 0 (对 OpenMIPS 而 言 ， 其 中 sel 域 也 为 0) o 


译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 、 要 执 
行 的 运算 等 三 个 方面 的 信息 。 以 下 分 别 解释 这 两 条 指令 的 译 码 工作 。 


(1) mfc0 指 令 


。 要 与 的 目的 寄存 器 : mfc0 指 令 需 要 将 读 取 的 CP0 中 寄存 器 的 
值 写 入 目的 寄存 器 ， 所 以 设置 wreg_o 为 WriteEnable， 同 时 ， 
参考 图 10-2 可 知 ， 要 写 的 目的 寄存 器 是 指令 中 的 16-20bit， 正 
是 指令 中 rt 的 值 ， 所 以 设置 wd_o 为 inst[20:16]。 

要 读 取 的 寄存 器 : mfc0 指 令 不 需要 读 取 通 用 寄存 器 ， 所 以 设 
置 regl_read_o、reg2_read_o 都 为 0。 

要 执行 的 运算 : 设置 alusel o/JEXE_RES_MOVE, ， 表 示 mfc0 
指令 也 是 一 种 移动 运算 ， 设 置 aluop_o 为 EXE_MFC0_OP， 表 
示 运 算 子 类 型 是 mfc0。 


(2) mtc0 指 令 


。 要 写 的 目的 寄存 器 : mtc0 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设 
置 wreg_o 为 WriteDisable。 

。 要 读 取 的 寄存 器 : mtc0 指 令 需 要 读 取 通 用 寄存 器 ， 所 以 设置 
regl_read_o 为 1， 表 示 通 过 Regfile 模 块 的 读 端口 1 读 取 数 据 ， 
读 取 地 址 reg1_addr_o 是 指令 中 的 第 16~20bit， 正 是 图 10-2 中 


的 rt 的 值 ， 所 以 最 终 译 码 阶段 的 输出 reg1_o 就 是 地 址 为 rt 的 通 
用 寄存 器 的 值 。 

。 要 执行 的 运算 : 设置 alusel_ 0 为 EXE_RES_MOVE， 表 示 mtc0 
指令 也 是 一 种 移动 运算 ， 设 置 aluop_o 为 EXE_MTC0_OP， 表 
示 运 算 子 类 型 是 mtc0。 


10.6.2 ”修改 执行 阶段 


1. 修改 EX 模 块 


参考 图 10-4 可 知 ，EX 模 块 需要 增加 一 些 接口 ， 新 增 接口 的 描述 如 
表 10-13 所 示 。 


7210-13 ”EX 模块 新 增加 接口 的 描述 


接口 名 输入 /输出 作 用 
从 CPO 模块 读 取 的 指定 寄存 器 的 


cp0 reg data i 3 输入 


沪 存 阶段 
的 寄存 器 
访 存 阶段 的 指令 要 写 的 CP0 中 寄 
TER 
访 存 阶段 的 指令 要 写 入 CPO PF 
存 器 的 数据 
回 写 阶段 的 指令 是 否 要 写 CP0 中 


的 寄存 器 


mem cp0 reg we 


mem cp0 reg write addr 


mem cp0 reg data 


的 指令 要 写 的 CP0 中 寄 


存 器 的 


wb cp0 reg data 3 输入 回 写 阶段 的 指令 要 写 入 CPO pA 
存 器 的 数据 
8 0 d add 5 行 阶段 的 指令 要 读 取 的 CP0 中 
cp0_reg read addr 0 ee 
= AN HEHE: 
| 行 阶段 的 指令 是 否 要 写 
cp0 reg We o A ar 
GUNS FIL ty H HE f h 2 
写 的 CPO pA 
cp0_reg write addr_o 5 il ae 
-人 | 的 地 起- 
0_reg dat 3 e \ 行 阶段 的 指令 要 写 入 CP0 中 寄 
cp0_reg_data_o E F DES 
存 器 的 数 


EX 模块 的 代码 主要 修改 如 下 ， 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter10 目 录 下 的 ex.v 文 件 。 


ii 
7 ib cp0 reg i 2 

1 

2 


module ex( 


// 访 存 阶 段 的 指令 是 否 要 写 CP9 中 的 寄存 器 ， 用 来 检测 数据 相关 
input wire mem_cp0_reg_we, 
input wire[4:0] mem_cp0_reg_write_addr, 


input wire[ RegBus mem_cp0_reg_data, 


end else begin 
cpO_reg_write_addr_o <= 5'b00000; 
cpo_reg_we_o <= ‘WriteDisable; 
cpo_reg_data_o <= Zeroword ; 

end 


end 


endmodule 


上 述 代码 可 以 分 为 三 段 理解 。 前 两 段 与 mnfc0 指 令 有 关 ， 最 后 一 段 
与 mtc0 指 令 有 关 。 


第 一 段 : 获得 CP0 中 指定 寄存 器 的 值 。 首 先 通 过 
cp0_reg_read_addr_o 向 CP0 模 块 送出 要 读 取 的 CP0 中 寄存 器 的 地 址 ， 从 
10.3 节 CP0 的 实现 代码 可 知 ， 读 取 操 作 是 组 合 逻 辑 ， 所 以 可 以 在 一 个 时 
钟 周期 内 给 出 相应 数据 ， 通 过 cp0_reg_data i 接口 送 入 EX 模块 ， 并 赋 给 
变量 moveres， 但 是 需要 注意 此 时 的 moveres 并 不 一 定 是 CP0 中 指定 寄存 
器 的 最 新 值 ， 还 要 判断 是 否 存在 数据 相关 。 所 以 下 面 接 着 判断 访 存 阶 
段 的 指令 是 否 要 写 CP0 中 的 寄存 器 ， 而 且 要 写 的 是 同一 个 寄存 器 ， 如 
果 是 ， 那 么 将 访 存 阶段 要 写 入 的 值 ， 作 为 CP0 中 指定 寄存 器 的 最 新 
值 ， 反 之 ， 继 续 判断 回 写 阶段 的 指令 是 否 要 写 CP0， 而 且 要 写 的 是 同 
一 个 寄存 器 ， 如 果 是 ， 那 么 将 回 写 阶段 要 写 入 的 值 ， 作 为 CP0 中 指定 
寄存 器 的 最 新 值 。 


第 二 段 : 依据 指令 的 运算 类 型 ， 确 定 最 终 要 写 入 目的 寄存 器 的 
值 ， 由 于 之 前 在 译 码 阶段 ， 将 指令 mfc0 的 运算 类 型 设置 为 
EXE_RES_MOVE， 所 以 会 将 moveres 的 值 作为 要 写 入 目的 寄存 器 的 
值 ， 此 处 的 moveres 是 在 第 一 段 代码 中 获取 的 。 


第 三 段 : 如 果 是 mtc0 指 令 ， 那 么 给 出 对 CP0 中 寄存 器 的 写 信息 : 
设置 写 操作 信号 cp0_reg_we_o 为 WriteEnable、 写 入 地 址 为 指令 中 第 11 
一 15bit 的 值 、 写 入 的 值 就 是 译 码 阶段 传递 过 来 的 reg1_ i 的 值 ， 参 考 
10.6.1 节 译 码 阶段 可 知 ， 该 值 正 是 地 址 为 rt 的 通用 寄存 器 的 值 。 


2。 修 改 EX/MEM 模 块 


EX/MEM 模 块 会 将 EX 模块 得 到 的 对 CP0 中 寄存 器 的 写 信息 向 流水 
线 下 一 级 传递 ， 参 考 图 10-4 可 知 ，EX/MEM 增 加 了 部 分 接口 ， 新 增 接 
口 的 作用 如 表 10-14 所 示 。 


表 10-14 EX/MEM 模 块 新 增 接口 的 描述 


pa RES 是 否 要 写 CP0 中 的 
ex cp0 reg we 输入 per 
奇 存 


阶段 的 指令 要 写 的 CPO 中 寄存 
ex cp0 reg write addr 


阶段 的 指令 要 写 入 CPO 中 寄存 
; 


ex_cp0 reg data 


mem cp0 reg we 阶段 的 指令 是 ERE Sun 中 的 
阶段 的 指令 要 写 的 CPO 中 寄存 
器 的 地 址 

访 存 阶段 的 指令 要 写 入 CP0 中 寄存 
器 的 数据 


mem cp0 reg write addr | 5 


mem_cp0_reg data 


EX/MEM 模 块 的 代码 主要 修改 如 下 。 完 整 代码 可 以 参考 本 书 附带 
光盘 中 Code\Chapter10 目 录 下 的 ex_mem.v 文 件 。 


10.6.3 ”修改 访 存 阶段 


1. 修改 MEM 模 块 


MEM 模 块 会 将 执行 阶段 传递 过 来 的 ， 对 CP0 中 寄存 器 的 写 信息 继 
续 传 递 到 流水 线 下 一 级 ， 参 考 图 10-4 可 知 ，MEM 模 块 增加 了 部 分 接 
口 ， 新 增 接口 的 作用 如 表 10-15 所 示 。 


表 10-15 MEM 模 块 新 增 接口 的 描述 


We Jia 


访 存 阶段 的 指令 是 否 要 写 CPO 中 
g 


) reg we i 


访 存 阶段 的 指令 要 写 的 CPO 中 寄 
地址 
访 存 阶段 的 指令 要 写 入 CP0 P 
数据 
访 存 阶段 的 指令 最 终 是 否 要 写 


中 的 寄存 器 


cp mil! A 

PA 访 存 阶段 的 指令 最 终 要 写 的 CPO 

3 cp0 reg write addr o | 5 条 出 Sacks Hi the 
中 寄存 器 的 地 址 

z 访 存 阶段 的 指令 最 终 要 写 入 CPO 
cp0 reg data_o 32 ER 

中 寄存 器 的 数据 


MEM 模 块 的 代码 主要 修改 如 下 ， 只 是 简单 地 将 对 CP0 中 宵 存 器 的 
与 信息 传递 到 流水 线 下 一 级 。 完 整 代码 可 以 参考 本 书 光盘 中 
Code\Chapter10 目 录 下 的 mem.v 文 件 。 


cp0 reg write addr i 


) reg data i 


| reg we_o 


module mem( 


input wire cpo_reg_we_i, 
input wire[4:0] cpo_reg_write_addr_i, 


input wire[ 'RegBus] cpo_reg_data_i, 


2。 修 改 MEMVWB 模 块 


MEMV/WB 模 块 会 将 MEM 模 块 传递 过 来 的 ， 对 CP0 中 寄存 器 的 写 信 
息 传递 到 回 写 阶段 ， 参 考 图 10-4 可 知 ，MEM/WB 模 块 增 加 了 部 分 接 
口 ， 新 增 接口 的 作用 如 表 10-16 所 示 。 


7210-16 MEMVWB 模 块 新 增 的 接口 描述 


一 一 一 一 一 一 


度 ( 
$ 
m= a 7 = " a i 
mem cp0 reg data 32 


e s| sens | 


RE ( 
> ler et 


wb_cp0_reg write_addr 


输入 输出 

访 存 阶 段 的 指令 是 否 要 写 CPO 
中 的 寄存 器 

访 存 阶段 的 指令 要 写 的 CP0 中 
寄存 器 的 地 址 

访 存 阶段 的 指令 要 写 入 CP0 中 
寄存 器 的 数据 


EE 
梧 写 阶 段 的 指令 是 否 要 写 CPO 
的 寄存 器 

可 写 阶段 的 指令 要 写 的 CP0 中 
寄存 器 的 地 址 


输入 


输入 


输入 


wb_cp0 reg data 


可 写 阶段 的 指令 要 写 入 CPO 中 
寄存 器 的 数据 


MEM/WB 模 块 的 代码 主要 修改 如 下 。 完 整 代 码 可 以 参考 本 书 附 带 
光盘 中 Code\Chapter10 目 录 下 的 mem_wb.v 文 件 。 


module mem_wb ( 


wb_cp0_reg_data <= "ZeroWord; 


end else if(stall[4] == "NoStop) begin 


// 在 访 存 阶段 没有 暂停 时 ， 将 对 CP9 中 寄存 器 的 写 信 息 传 递 到 回 写 阶 


wb_cp0_reg_we <= mem_cp0_reg we; 
wb_cp0_reg write_addr <= mem_cp0_reg write_addr; 


wb_cp0_reg_ data <= mem_cp0_reg data; 


end 


end 


endmodule 


10.6.4 ”修改 OpenMIPS 模 块 


因为 修改 了 一 些 模块 的 接口 ， 所 以 需要 修改 OpenMIPS 模 块 ， 按 照 
图 10-4 所 示 ， 将 新 增加 的 接口 连接 在 一 起 。 需 要 注意 一 点 ，OpenMIPS 
模块 本 身 也 增加 了 两 个 接口 : int_i、timer int_o。 具 体 代 码 不 在 书 中 给 


出 ， 读 者 可 以 参考 本 书 光 附带 光盘 Code\Chapter10 目 录 下 的 openmips.v 
文件 。 


10.7 Witte 


为 了 验证 本 章 添 加 的 协 处 理 器 CP0， 以 及 协 处 理 器 访问 指令 
mfc0、mtc0 是 否 实现 正确 ， 编 写 测 试 程序 如 下 ， 产 文件 是 本 书 附 市 光 
盘 中 Code\Chapter10\AsmTest 目 录 下 的 inst_rom.S 文 件 。 


.org 0x0 
.set noat 
.set noreorder 
.set nomacro 
.global _start 
_Start: 
ori $1,$0, Oxf # $1 = Oxf 
mtcO $1,$11,0x0 + 将 09xf 写 入 CP9 中 的 Compare 寄 存 器 


lui $1,0x1000 
ori $1,$1,0x401 # $1 = 0x10000401 
mtcO $1,$12,0x0 # 将 9x10000401 写 入 CP9 中 的 Status 寄 存 器 
mfcO $2,$12,0x0 # 读 Status 寄 存 器 ， 保 存 到 寄存 器 $2 $2 = 
0x10000401 


_loop: 


j _loop 


nop 


程序 首先 写 Compare 寄 存 器 ， 使 其 值 等 于 0xf。 这 样 ， 第 15 个 时 钟 

周期 ，Count 寄 存 器 的 值 等 于 Compare 寄 存 器 的 值 ， 会 输出 时 钟 中 断 

(timer_int_o 为 1) 。 程 序 接着 将 0x10000401 写 入 Status 寄 存 器 ， 然 后 

读 出 Status 寄 存 器 的 值 ， 保 存 到 寄存 器 $2， 用 以 验证 读 出 、 写 入 CP0 中 

寄存 器 是 否 正 确 。ModelSim 仿真 效果 如 图 10-6 所 示 ， 从 中 可 知 
OpenMIPS 正 确实 现 了 协 处 理 器 CP0， 以 及 协 处 理 器 访问 指令 mfc0、 

mtc0o。 
CL) 复位 结束 后 ，Count 寄 存 器 的 值 在 每 个 时 钟 周期 加 1 小 
Æ rst sto 
® dk sto 


+4 中 0_reg0jcount o 000... 
63-44 中 0_reg0/compare o [ 000... 


4% timer_int_o 0 
34% cp0_reg0/status_o 100... 
34 regfile1/regs[1] 100... 

® rst sto 

® dk Sti 


E- qh0_reg0/count_o 000... 
4 中 0_reg0/compare o  |000... 


dl timer_int_o 1 
4 中 0_reg0/status o 100... 
5-4 regfile1/regs[1] 100... E 
5-4 regfile1/regs[2] 100... = - (10000401, o 


(3) Status 寄 存 器 的 值 被 设置 为 0x10000401 一 | 
(4) mfe0 指 令 读 取 Status 寄 存 器 的 值 ， 读 出 的 数据 保存 到 寄存 器 $2， 正 是 0x10000401 | 


» rst sto 
® dk sto 
3-4 qh0_reg0/count_o 000... 
5-4 (p0_reg0/compare_o — |000... 


«lx timer_int_o 1 


(5) County fr. F Compare ay FFA HIN Ws EEN, xe 


也 就 是 设置 timer_int_o 信 号 为 1 


图 10-6 ”ModelSim 仿 真 测试 效果 


第 11 章 ”异常 相关 指令 的 实现 


本 章 是 实现 教学 版 OpenMIPS 处 理 器 的 最 后 一 步 ， 将 实现 异常 相关 
指令 。 首 先 在 11.1 节 介绍 MIPS32 架 构 中 定义 的 异常 类 型 ， 明 确 了 
OpenMIPS 处 理 器 能 够 处 理 的 其 中 几 种 异常 类 型 。 随 后 在 11.2 节 解释 精 
确 异 常 的 概念 ，OpenMIPS 处 理 器 能 够 做 到 精确 异常 。11.3 节 介绍 
OpenMIPS 处 理 器 的 异常 处 理 过 程 ， 这 个 过 程 与 MIPS32 架 构 定 义 的 异 
常 处 理 过 程 稍微 有 些 区 别 ， 为 的 是 简单 ， 易 于 理解 。 然 后 在 11.4 节 对 
异常 相关 指令 给 出 了 说 明 ， 包 括 自 陷 指令 、 系 统 调 用 指令 syscall、 异 
常 返回 指令 eret 等 。11.5 节 说 明 异 常 相关 指令 的 实现 思路 ， 以 及 为 了 实 
现 异常 相关 指令 而 对 数据 流 图 、 系 统 结构 作 的 修改 。11.6 节 通过 修改 
OpenMIPS 的 代码 实现 异常 相关 指令 。11.7 节 再 次 修改 了 最 小 SOPC， 
将 时 钟 中 断 输出 接口 与 其 中 一 个 中 断 输入 接口 相连 ， 这 样 OpenMIPS 就 
可 以 了 响应 时 钟 中 断 异 常 了 。11.8 节 编写 了 3 个 测试 程序 ， 用 于 验证 异常 
相关 指令 是 否 实现 正确 。 


11.1 MIPS32 染 构 中 定义 的 异常 类 
型 


在 MIPS32 架 构 中 ， 有 一 些 事件 要 打 断 程序 的 正常 执行 流程 ， 这 些 
事件 有 中 断 (Interrupt) 、 陷 阱 (Trap) 、 系 统 调用 (System Call) 以 
及 其 他 任何 可 以 打 断 程序 正常 执行 流程 的 情况 ， 统 称 为 异常 。 异 常 类 
型 及 其 优先 级 如 表 11-1 所 示 。 读 者 朋友 如 果 没 有 时 间 ， 可 以 只 理解 其 
中 使 用 灰色 背景 标注 的 异常 ，OpenMIPS 处 理 器 也 只 实现 了 对 这 些 异 常 
的 响应 处 理 。 


表 11-1 MIPS32 架 构 中 定义 的 异常 类 型 及 其 优先 级 


优先 级 


E — nna 


s 在 发 生 致命 错误 后 对 系统 的 复 
oft Reset 
位 ， 是 软 复位 


CU A 


发 生 在 8 个 中 断 之 一 被 检测 到 
Interrupt 时 ， 包 括 6 个 外 部 硬件 中 断 、2 
个 软件 中 断 


e E Hardware Instruction 
DIB Break Match， 指 令 硬 件 断 点 和 
正在 执行 的 指令 相符 合 
10 WATCH GUL S M SEAR 的 地 
址 相同 时 发 生 


11 AdEL Fetch Address Align Error 取 指 地 


En 2 O O 


ILB 
TLBL 
TLB > 


e b 
ia ae econ tie Bus Error 取 指 
x 总 线 Ta IR 
ee 


Cm Te 


在 协 处 理 器 不 存在 或 不 可 用 的 
情况 下 ， 执行 了 协 处 理 器 指令 


16 


算术 操作 指令 add、addi、sub 运 
算 涝 出 


Data Address Break or Data Value 
DDBL/DDBS Break on Store 存 储 过 程 中 ， 数 
据 地 址 断 点 或 数据 值 断 点 


| 数据 地 址 与 观测 寄存 器 中 的 地 


| sd ARABI 时 发 生 


Eu 加 载 数据 的 地 址 未 对 章 


AdES AdES | 存储 数据 的 地 址 未 对 章 | 


ae 


2 [ma TB Mod | TLB Mod 。 | 对 不 可 写 的 TLB 进 行 了 写 操作 | 可 写 的 TLB 进 行 了 写 操作 


C C n LEE 


Data Hardware Breakpoint 

ar matched in load data compare 加 
载 的 数据 与 硬件 断 点 设置 的 数 
据 相 等 


OpenMIPS 处 理 器 只 实现 对 其 中 6 种 异常 情况 的 处 理 ， 列 举 如 下 : 


硬件 复位 ; 

。 中 断 〈 包 含 软 中 断 、 硬 中 断 ) ; 
。 Syscall 系 统 调用 ; 

无 效 指 令 ; 

mt; 

。 目 陷 指令 引 友 的 异 单 。 


异常 发 生 后 ， 会 进入 异常 处 理 例 程 进行 具体 的 异 党 处理， 处理 结 
束 后 ， 返 回 到 异常 发 生前 的 状态 继续 执行 。 在 上 面 的 6 种 异常 中 ， 硬 件 
复位 是 一 种 特殊 的 异常 ， 特 殊 之 处 在 于 不 用 从 异常 处 理 例 程 运 回 ， 所 
以 不 用 考虑 保护 现场 ， 也 不 用 保存 返回 地 址 ，OpenMIPS 对 硬件 复位 异 
常 的 处 理 方法 是 很 简单 的 : 全 部 寄存 器 清 零 ， 从 地 址 0x0 处 取 指 执行 ， 
这 实际 也 就 是 复位 的 过 程 。 所 以 硬件 复位 异常 的 处 理 过 程 不 再 论述 ， 
本 章 只 论述 其 余 5 种 异常 的 处 理 过 程 。 


12 ”精确 异常 


在 MIPS 的 文档 中 经 常会 读 到 “精确 异常 * 这 个 术语 ，OpenMIPS 的 
实现 赣 图 中 也 设计 为 实现 精确 异常 ， 本 节 将 介绍 精确 异常 的 相关 概 
念 


o 


当 一 个 异常 发 生 后 ， 系 统 的 顺序 执行 会 被 中 断 ， 此 时 有 若干 条 指 
令 处 于 流水 线 上 的 不 同 阶段 ， 处 理 器 会 转移 到 异常 处 理 例 程 ， 异 常 处 
理 结束 后 返回 原 程序 继续 执行 ， 因 为 不 希望 异常 处 理 例 程 破坏 原 程序 
的 正常 执行 ， 所 以 对 于 异 音 发生 时 ， 流 水 线 上 没有 执行 完 的 指令 ， 必 
须 记 住 它 处 于 流水 线 的 哪 一 个 阶段 ， 以 便 异常 处 理 结束 后 能 恢复 执 
行 ， 这 便 是 精确 异常 。 


对 于 一 个 实现 精确 异常 的 处 理 器 ， 在 异常 发 生 时 ， 都 会 有 一 个 被 
异常 打 断 的 指令 ， 称 为 异常 受害 者 (Exception Victim) , HAMAR 
生 异 常 的 指令 ， 该 指令 前 面 的 所 有 指令 都 要 被 执行 到 流水 线 的 最 后 一 
个 阶段 ， 也 就 是 正常 执行 完成 ， 但 是 该 指令 及 该 指令 之 后 的 指令 都 要 
被 取消 ， 融 像 从 来 没有 执行 过 一 样 。 如 图 11-1 所 示 。 第 2 条 指令 add 在 
执行 阶段 发 生 溢 出 异常 ， 在 这 种 情况 下 ， 已 经 到 达 访 存 阶段 的 第 1 条 指 


令 ori 会 继续 执行 完成 ， 而 第 2、3、4 条 指令 都 会 被 取消 ， 不 会 有 任何 
影响 处 理 器 的 情况 友 生 ， 融 像 没 有 进 过 流水 绪 一 样 。 


时 钟 e À PA \ \ ieg 1 


/ ¡E 


1 ori $1,80,0x1100 < 取 指 > BE > 执行 > 访 存 xl > 


Y to AR e E RR ZEN UN 
2 add $1,$5,$10 人 取 指 X PHB X 执行 六 访 存 A HS > 
p a eer are IN Y = > ok. KH ZEN 
3 andi $3,$1,0x400 <a > > A AA > 
4 subi$4,$1,0x004 <a > rt > 回 写 > 


ITA 


图 11-1 精确 异常 示例 


为 了 实现 精确 异常 ， 必 须要 求 异 常 发 生 的 顺序 与 指令 的 顺序 相 
同 ， 在 非 流 水 线 的 处 理 器 上 ， 这 一 点 是 显然 的 ， 但 是 对 于 拥有 流水 线 
的 处 理 器 ， 就 会 有 些 复杂 。 在 流水 线 处 理 器 上 ， 异 常会 在 流水 线 的 不 
同 阶 段 发 生 ， 带 来 潜在 的 问题 。 比 如 : 以 图 11-2 为 例 ， 加 载 指 令 ]w 会 
在 流水 线 的 访 存 阶段 发 生地 址 未 对 齐 的 异常 (因为 加 载 地 址 是 0x3， 指 
令 ]w 要 求 加 载 地 址 的 最 后 两 位 为 00) ， 该 异常 应 该 会 在 第 4 个 时 钟 周 期 
发 生 ， 而 它 的 后 一 条 指令 di 是 无 效 指令 (MIPS32 架 构 并 没有 定义 该 指 
令 ， 所 以 是 无 效 指令 ) ， 会 在 流水 线 的 译 码 阶 段 引 发 无 效 指令 异常 ， 
也 就 是 在 第 3 个 时 钟 周期 ， 而 此 时 上 一 条 加 载 指 令 lw 还 处 于 执行 阶段 ， 
没有 进入 访 存 阶段 ， 所 以 先 发 生 的 异常 就 是 无 效 指令 异常 。 从 而 不 满 
足 异 常 发 生 的 顺序 与 指令 的 顺序 相同 这 一 要 求 。 


地 址 未 对 齐 寞 第 | 


TES 3 Na paca E 


1 1W81,x380) <a lr CFE ACME > 


2 di$1,$5,$1 KTE Mt A > 
无 效 指令 异常 


图 11-2 ”在 流水 线 处 理 器 中 ， 异 常 发 生 的 顺序 与 指令 的 顺序 不 一 定 相同 


为 了 避免 上 述 情况 ， 先 发 生 的 异 音 并 不 立即 处 理 ， 异 单 事 件 只 是 
被 标记 ， 并 继续 运行 流水 线 。 在 大 多 效 处 理 器 中 ， 会 设计 一 个 特殊 的 
流水 线 阶段 ， 专 门 用 于 处 理 异常 。 如 果 某 一 条 指令 的 异常 事件 到 达 了 
流水 线 的 这 个 阶段 ， 那 么 会 进行 异常 处 理 ， 并 且 当 前 处 于 流水 线 其 余 
阶段 的 指令 的 异常 事件 都 会 被 忽略 。 还 是 以 图 11-2 为 例 ， 假 设 处 理 器 
会 在 访 存 阶段 处 理 异常 情况 ， 那 么 di 指令 虽然 在 第 3 个 时 钟 周 期 发 生 了 
异常 ， 但 是 并 不 处 理 ， 只 是 保存 一 个 异常 标记 ， 等 到 第 5 个 时 钟 周 期 该 
指令 进入 访 存 阶段 时 再 处 理 。 但 是 ， 在 第 4 个 时 钟 周 期 ， 上 一 条 指令 lw 
进入 了 访 存 阶段 ， 并 且 发 生 了 地 址 未 对 齐 异常 ， 因 为 已 经 处 于 访 存 阶 
段 了 ， 所 以 会 处 理 该 异常 ， 而 包括 无 效 指令 异常 在 内 的 流水 线 其 余 阶 
段 的 异 弟 都 被 忽略 。 


通过 以 上 方法 就 可 以 在 流水 线 处 理 器 中 实现 “ 按 指令 执行 的 顺序 处 
理 异常 ， 而 不 是 按 异 常 发 生 的 顺序 处 理 异 常 处 理 ”。 


113 ”异常 处 理 过 程 


当 检 测 到 异常 发 生 后 ， 处 理 器 会 执行 一 系列 动作 以 处 理 异常 ， 不 
同 处 理 器 的 处 理 过 程 也 不 同 ，OpenMIPS 处 理 器 的 处 理 过 程 如 下 。 


(1) 检测 CP0 中 Status 寄 存 器 的 EXL 字 段 ， 分 两 种 情况 。 


。 如 果 EXL 为 1， 表 示 当 前 已 经 处 于 异常 处 理 过 程 中 了 ， 此 时 ， 
如 果 当 前 发 生 的 异常 类 型 是 中 断 ， 那 么 不 处 理 ， 忽 略 该 异 
常 ， 因 为 在 异常 处 理 过 程 中 会 禁止 中 断 。 如 果 当 前 发 生 的 异 
常 类 型 不 是 中 断 ， 那 么 将 异常 原因 保存 到 CP0 中 Cause 寄 存 器 
的 ExcCode 字 段 ， 转 到 步骤 (4) o 

e 如 果 EXL 为 0， 那 么 将 异常 原因 保存 到 CP0 中 Cause 寄 存 器 的 
ExcCode 字 段 ， 进 入 步骤 (2) o 


(2) MEARE SNC SHERRIE, SREB, A 
么 设置 EPC 寄 存 器 的 值 为 该 指令 的 地 址 减 4， 同 时 设置 Cause 寄 存 器 的 
BD 字 段 为 1， 反 之 ， 设 置 EPC 寄 存 器 的 值 就 为 该 指令 的 地 址 ， 同 时 设 
置 Cause 寄 存 器 的 BD 字 段 为 0。 


(3) 设置 Status 寄 存 器 的 EXL 字 段 为 1， 表 示 进 入 异常 处 理 过 程 ， 
禁止 中 断 。 


(4) 处 理 器 转移 到 事先 定义 好 的 一 个 地 址 ， 在 那个 地 址 中 往往 有 
异常 处 理 例 程 ， 在 其 中 进行 异常 处 理 ， 这 个 地 址 称 为 异常 处 理 例 程 入 
口 地 址 。OpenMIPS 定 义 的 异常 处 理 例 程 入 口 地 址 如 表 11-2 所 示 。 此 处 
对 系统 调用 、 无 效 指令 、 洪 出 、 自 陷 这 四 类 异常 都 设置 为 相同 的 处 理 
例 程 入 口 地 址 ， 当 然 也 可 以 设置 为 不 同 的 地 址 ， 读 者 在 阅读 完 本 章 
后 ， 将 学 会 如 何 根据 情况 自行 修改 。 


以 上 就 是 OpenMIPS 处 理 器 在 检测 到 异常 发 生 后 的 处 理 过 程 ， 可 以 
使 用 图 11-3 描 述 。 熟 悉 MIPS32 架 构 中 异常 处 理 过 程 的 读者 可 能 会 注意 
到 上 述 过 程 与 MIPS32 架 构 中 的 异常 处 理 过 程 只 有 一 点 不 同 ， 那 就 是 对 
异常 处 理 例 程 入 口 地 址 的 规定 不 同 。OpenMIPS 处 理 器 由 于 没有 
MMU， 所 以 将 异常 处 理 例 程 入 口 地 址 都 放 在 低地 址 空间 。 


HERA 
an a ~ e = 1 
< EXL > p 中 断 ? 一 一 一 > 不 处 理 
| =0 8) 
y 
Cause[ExcCode] <- 异常 原因 Cause[ExcCode] <- 异常 原因 


-一 指令 在 延迟 槽 中 > > 
El 8 oo 不 
十 a (=) 


EPC <- PC - 4 EPC <- PC 
Cause[BD] <- 1 Cause[BD] <- 0 


EXL <- 1 


转移 到 相应 的 异常 
处 理 例 程 入 口 地 址 


图 11-3 ”OpenMIPS 处 理 器 的 异常 处 理 过 程 


在 异常 处 理 例 程 中 会 进行 具体 的 异常 处 理 ， 处 理 结束 后 ， 需 
回 到 异常 发 生前 的 状态 继续 执行 。MIPS32 指 令 Me ER 
eret 来 完成 此 项 工作 。eret 指 令 既 要 清除 Status 寄 存 器 的 EXL 字 段 ， 从 而 
使 能 中 断 ， 还 要 将 EPC 寄 存 器 保存 的 地 址 恢复 到 PC 中 ， 从 而 返回 到 异 
常 发 生 处 继续 执行 。 


表 11-2 ”OpenMIPS 处 理 器 定义 的 异常 处 理 例 程 入 口 地 址 


处 理 例 程 
地 址 


引起 异常 的 条 件 


中 断 (Interrupt) 硬件 或 软件 中 断 


读者 可 能 会 注意 到 这 个 问题 : 如 果 发 生 异 单 的 指令 在 延迟 槽 中 ， 
那么 保存 到 寄存 器 EPC 的 值 是 PC .4， 如 果 发 生 异 常 的 指令 不 在 延迟 村 
中 ， 那 么 保存 到 寄存 器 EPC 的 值 是 PC， 为 何 会 有 这 种 区 别 呢 ? 


这 是 因为 在 引入 延迟 槽 之 前 ， 处 理 器 执行 转移 指令 的 顺序 是 。 
转移 指令 -> 转移 目标 地 址 的 指令 
引入 延迟 槽 之 后 ， 处 理 器 执行 转移 指令 的 顺序 是 。 
转移 指令 -> 延迟 槽 指令 -> 转移 目标 地 址 的 指令 


在 中 间 插 入 了 延迟 槽 指令 ， 当 延迟 槽 中 的 指令 发 生 异 单 时 ， 如 果 
在 寄存 器 EPC 中 保存 延迟 槽 指令 的 地 址 ， 那 么 从 异常 处 理 例 程 返 回 
时 ， 将 回 到 延迟 槽 指令 的 地 址 处 ， 重 新 执行 的 指令 顺序 将 是 。 


延迟 槽 指令 -> 延迟 槽 指令 的 下 一 条 指令 


可 见 没 有 发 生 转 移 ， 这 样 就 不 是 被 打 断 之 前 的 指令 顺序 ， 所 以 ， 
为 了 恢复 原来 的 指令 顺序 ， 在 这 里 将 延迟 槽 之 前 的 转移 指令 的 地 址 保 
存 到 寄存 器 EPC 中 ， 也 就 是 PC-4。 


11.4 异常 相关 指令 介绍 


MIPS32 指 令 集 架构 中 定义 的 异常 相关 指令 包括 : 自 陷 指 令 、 系 统 
调用 指令 syscall、 异 单 返 回 指令 eret， 下 面 分 别 介绍 。 


11.4.1 HHS 


自 陷 指令 有 12 条 ， 按 照 指令 中 是 否 包含 立 即 数 ， 可 以 分 为 两 类 。 
1. 不 包含 立即 数 的 自 陷 指令 


不 包含 立即 数 的 自 陷 指 令 有 6 条 ， 指 令 格式 如 图 11-4 所 示 。 


31 26 25 21 20 16 15 6 5 0 


H = rt code k- To teq 指 令 
“ROOT m rt code j A tge 指 令 
a = rt code —A tl 指令 
po = rs rt code Lod ttu 指 令 
poy i rt code i ol tne 指 今 


图 11-4 不 包含 立即 数 的 自 陷 指 令 


从 图 11-4 中 可 知 ， 这 6 条 自 陷 指令 都 是 R 类 型 指令 ， 且 指令 码 都 是 
SPECIAL， 可 以 依据 第 0 一 5bit 功 能 码 的 值 确定 是 哪 一 种 指令 。 另 外 ， 
指令 的 第 6 一 15bit 都 是 code 字 段 ， 该 字段 在 译 码 过 程 中 没有 作用 ， 被 忽 
略 掉 ， 但 是 软件 可 以 利用 这 个 字段 保存 一 些 信息 。 


。 当 功 能 码 为 6b110100 时 ， 是 teq 指 令 。 
指令 用 法 为 : teq rs, rto 


指令 作用 为 : if GPR[rs] = GPR[rt then trap， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 进 行 比较 ， 如 果 两 者 相等 ， 
那么 引发 自 陷 异 单 。 


。 当 功 能 码 为 6b110000 时 ， 是 tge 指 令 。 
指令 用 法 为 : tge rs, rto 


指令 作用 为 : if GPR[rs] > GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 有 符号 数 进行 比较 ， 如 


果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 异常 。 
。 当 功 能 码 为 6b110001 时 ， 是 tgeu 指 令 。 
指令 用 法 为 : tgeu rs, rto 


指令 作用 为 : if GPR[rs] > GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 进行 比较 ， 如 
果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 异常 。 


。 当 功能 码 为 6b110010 时 ， 是 tt 指令 。 
指令 用 法 为 : tlt rs, rto 


指令 作用 为 : if GPR[rs] < GPR[rd then trap， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 有 符号 数 进 行 比较 ， 如 
果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异常 。 


。 当 功 能 码 为 6b110011 时 ， 是 tttu 指 令 。 
指令 用 法 为 : tltu rs, rto 


指令 作用 为 : if GPR[rs] < GPR[rd then trap ， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 rt 的 通用 寄存 器 的 值 作为 无 符号 数 进 行 比较 ， 如 
果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异常 。 


。 当 功能 码 为 6b110110 时 ， 是 tne 指 令 。 


指令 用 法 为 : tne rs, rto 


指令 作用 为 : if GPR[rs] 4 GPR[rt] then trap， 将 地 址 为 rs 的 通用 寄 
存 器 的 值 ， 与 地 址 为 zt 的 通用 寄存 器 的 值 进 行 比较 ， 如 果 两 者 不 相 
等 ， 那 么 引发 自 陷 异常 。 


2. 包含 立即 数 的 自 陷 指令 


包含 立即 数 的 自 陷 指 令 也 有 6 条 ， 指 令 格式 如 图 11-5 所 示 。 


31 26 25 21 20 16 15 0 


er rs aan immediate teqi 指 令 
ora rs eae immediate tgei 指 令 
ae rs ee immediate tgeiu 指 令 
REGIMM = en immediate tlti 指 令 
poe rs ber immediate tltiu 指 令 
Sate rs en immediate tnei 指 令 


图 11-5 ”包含 立即 数 的 自 陷 指令 


从 图 11-5 可 知 ， 这 6 条 自 陷 指令 都 是 I 类 型 指令 ， 且 指令 码 都 是 
REGIMM， 可 以 依据 第 16~20bit 的 值 确定 是 哪 一 种 指令 。 这 6 条 自 陷 
指令 与 之 前 不 包含 立即 数 的 6 条 自 陷 指 令 的 区 别 在 于 ， 此 处 的 自 陷 判断 
条 件 不 再 是 两 个 寄存 器 的 比较 结果 ， 而 是 一 个 寄存 器 与 指令 中 立即 数 
的 比较 结果 。 


。 当 第 16~20bit 的 值 为 5"'b01100 时 ， 表 示 是 teqi 指 令 。 


指令 用 法 为 : teqi rs, immediateo 


指令 作用 为 : if GPR[rs] = sign_extended(immediate) then trap, + 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 
的 值 进 行 比较 ， 如 果 两 者 相等 ， 那 么 引发 自 陷 异 常 。 


。 当 第 16~20bit 的 值 为 5b01000 时 ， 表 示 是 tgei 指 令 。 
指令 用 法 为 : tgei rs, immediateo 


指令 作用 为 : 让 GPR[rs] > sign_extended(immediate) then trap, 3% 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 
的 值 作为 有 符号 数 进行 比较 ， 如 果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 


异常 。 
。 当 第 16~20bit 的 值 为 5b01001 时 ， 表 示 是 tgeiu 指 令 。 
指令 用 法 为 : tgeiu rs, immediateo 


指令 作用 为 : 让 GPR[rs] > sign_extended(immediate) then trap, ， 将 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符 号 扩展 至 32 位 后 
的 值 作为 无 符号 数 进 行 比较 ， 如 果 前 者 大 于 等 于 后 者 ， 那 么 引发 自 陷 


异 弟 6 
e 当 16-20bit 的 值 为 5b01010 时 ， 表 示 是 tti 指 令 。 
指令 用 法 为 : tlti rs, immediate. 


指令 作用 为 : if GPR[rs] < sign_extended(immediate) then trap ， 将 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符 号 扩展 至 32 位 后 
的 值 作 为 有 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异 
o 


。 当 16-20bit 的 值 为 5b01011 时 ， 表 示 是 tltiu 指 令 。 
指令 用 法 为 : tltiu rs, immediate。 


指令 作用 为 : 证 GPR[rs] < sign_extended(immediate) then trap ， 将 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 
的 值 作为 无 符号 数 进行 比较 ， 如 果 前 者 小 于 后 者 ， 那 么 引发 自 陷 异 
o 


e 当 16-20bit 的 值 为 5b01110 时 ， 表 示 是 tnei 指 令 。 
指令 用 法 为 : tnei rs, immediate, 


指令 作用 为 : 让 GPR[rs] # sign_extended(immediate) then trap, ， 将 
地 址 为 rs 的 通用 寄存 器 的 值 ， 与 指令 中 16 位 立即 数 符号 扩展 至 32 位 后 
的 值 进 行 比较 ， 如 果 两 者 不 相等 ， 那 么 引发 自 陷 异常 。 


11.4.2 ”系统 调用 指令 syscall 


系统 调用 指令 syscall 的 格式 如 图 11-6 所 示 。 


31 26 25 6 5 0 


SPECIAL SYSCALL meee 
000000 code 和 syscall 指 令 


图 11-6 ”syscall 指 令 的 格式 


从 图 11-6 可 知 ，syscall 指 令 的 指令 码 是 SPECIAL， 可 以 依据 第 0 人 ~ 
5bit 功 能 码 是 否 是 6b001100， 进 而 判断 是 否 是 syscall 指 令 。 另 外 ， 指 令 
中 的 第 6 一 25bit 是 code 字 段 ， 该 部 分 在 译 码 过 程 中 没有 作用 ， 被 忽略 
掉 ， 但 是 软件 可 以 利用 这 个 字段 保存 一 些 信息 。 


指令 用 法 为 : syscallo 


指令 作用 为 : 引发 系统 调用 异常 。MIPS32 架 构 定义 了 处 理 器 的 两 
种 工作 模式 : 用 户 模式 、 内 核 模 式 ， 前 一 种 是 受 限 模式 ， 有 些 操作 无 
法 进行 ， 大 多 用 于 用 户 的 应 用 程序 ， 后 者 主要 用 于 处 理 异 常 和 具有 优 
先 权 的 操作 系统 函数 ， 包 括 管理 协 处 理 器 CP0 和 IO 等 。 用 户 模式 下 的 
程序 为 了 执行 一 些 在 内 核 模 式 下 才能 进行 的 操作 ， 可 以 调用 syscall 指 
令 ，，5 引 发 系统 调用 异常 ， 进 入 异常 处 理 例 程 ， 从 而 进入 内 核 模 式 。 
用 户 模式 、 内 核 模 式 的 状态 标记 是 CP0 中 Status 寄 存 器 的 UM 字 段 。 


OpenMIPS 不 区 分 用 户 模式 、 内 核 模 式 ， 所 以 没有 使 用 Status 寄 存 
器 的 UM 字段 ， 也 就 是 说 ， 所 有 的 操作 都 没有 限制 ， 但 是 为 了 兼容 


MIPS32 指 令 集 架构 ， 还 是 实现 了 syscall 措 令 。 


11.4.3 ”异常 返回 指令 eret 


异常 返回 指令 eret 的 格式 如 图 11-7 所 示 。 


31 26 25 24 6 5 0 


COP0 |CO ERET te 
010000 1 0000 0000 0000 0000 000 011000 eret}; 


A> 


的 


图 11-7 异常 返回 指令 eret 的 格式 


从 图 11-7 可 知 ，eret 的 指令 码 是 COP0， 与 上 一 章 实现 的 指令 
mtc0、 mfc0 的 指令 码 是 一 样 的 ， 但 是 第 0 和 ~ 5bit 功 能 码 的 值 是 
6b011000， 而 且 第 25bit 为 1， 第 6 一 24bit 都 为 0。 


指令 用 法 为 : eret 


指令 作用 为 : 从 异 单 处 理 例 程 返 回 ， 执 行 该 指令 ， 会 进行 如 下 操 
作 。 


(1) 使 FPC 寄存 器 的 值 成 为 新 的 取 指 地 址 。 


(2) 设置 Status 寄 存 器 的 EXL 字 段 为 0， 表 示 不 再 处 于 异 音 级。 


15 “异常 处 理 实现 思路 


OpenMIPS 处 理 器 能 够 处 理 的 几 种 异常 ， 包 括 异 常 相关 指令 引起 的 
异常 ( 自 陷 指令 、syscall、 无 效 指令 ) 、 外 部 中 断 引 起 的 异常 ， 以 及 
执行 算术 运算 出 现 溢 出 引起 的 异常 。 这 几 种 异常 的 处 理 过 程 都 是 一 致 
的 。 另 外 ， 在 实现 异常 处 理 的 过 程 中 ， 自 然 就 实现 了 syscall、 自 陷 指 
令 等 异常 相关 指令 ， 所 以 本 节 以 及 11.6 节 都 是 从 实现 异常 处 理 的 角度 
讲解 ， 而 不 是 从 异常 相关 指令 的 角度 讲解 。 


还 有 一 点 ， 里 然 异常 返回 指令 eret 不 是 引起 异常 的 指令 ， 但 是 eret 
的 执行 效果 与 异常 的 效果 非常 相似 : 取消 随后 所 有 指令 的 执行 、 转 移 
到 新 的 目标 地 址 (对 于 eret 指 令 而 言 ， 就 是 EPC 中 保存 的 地 址 ) 。 所 以 
eret 指 令 的 处 理 过 程 与 异常 处 理 过 程 也 是 类 似 的 ， 可 以 称 为 “返回 异 
常 ”。 本 章 结合 异常 处 理 的 实现 过 程 一 并 介绍 eret 指 令 的 实现 过 程 。 


11.5.1 ”实现 思路 


OpenMIPS 异 常 处 理 的 实现 思路 是 : 在 流水 线 的 各 个 阶段 收集 异常 
信息 ， 并 传递 到 流水 线 访 存 阶段 ， 在 访 存 阶段 统一 处 理 异 常 信 息 。 流 


水 线 各 个 阶段 需要 收集 的 异常 信息 如 下 。 


。 在 流水 线 译 码 阶段 判断 是 否 是 系统 调用 异常 、 是 否 是 返回 指 
令 、 无 效 指令 。 

。 在 流水 线 执行 阶段 判断 是 否 有 自 陷 异常 、 溢 出 异常 。 

.在 流水 线 访 存 阶段 检查 是 否 有 中 断 发 生 。 


在 流水 线 访 存 阶 段 ， 处 理 器 将 结合 协 处 理 器 CP0 中 相关 寄存 器 的 
值 ， 判 断 异 常 是 否 需 要 处 理 ， 如 果 需 要 处 理 ， 那 么 转移 到 该 异常 对 应 
的 处 理 例 程 入 口 地 址 ， 清 除 流水 线 上 除 回 写 阶 段 外 的 全 部 信息 ( 回 写 
阶段 的 指令 要 继续 执行 ， 参 考 “ 精 确 异常 * 一 节 的 描述 ) ， 同 时 ， 修 改 
协 处 理 器 CP0 中 相关 寄存 器 的 值 。 


如 果 是 eret 指 令 ， 那 么 转移 到 EPC 寄 存 器 保存 的 地 址 处 ， 同 时 ， 也 
要 清除 流水 线 上 除 回 写 阶段 外 的 全 部 信息 ， 修 改 协 处 理 器 CP0 中 相关 
寄存 器 的 值 。 


清除 流水 线 上 某 个 阶段 的 信息 ， 实 际 就 是 将 该 阶段 中 的 所 有 寄存 
器 设置 为 初始 值 即 可 。 


11.5.2 ”修改 数据 流 图 


添加 异常 处 理 后 的 数据 流 图 如 图 11-8 所 示 ， 相 比 图 10-3， 在 访 存 
阶段 增加 了 异常 判断 模块 ， 主 要 作用 是 依据 从 译 码 、 执 行 阶段 传递 过 
来 的 信息 ， 以 及 CP0 中 寄存 器 的 值 ， 判 断 是 否 要 处 理 异常 ， 如 果 要 处 
理 异常 ， 那 么 按照 异常 类 型 给 出 新 的 指令 地 址 送 入 PC。 


of 异常 
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2118 添加 异常 处 理 后 的 数据 流 图 


11.5.3 ”修改 系统 结构 


为 了 实现 异常 处 理 ， 需 要 修改 系统 结构 ， 添 加 部 分 接口 ， 如 图 11- 
9 所 示 。 主 要 有 如 下 几 点 说 明 。 


CTRL 


new_pe 
Py cp0_epci fush 


1 1 上 
1 1 1 
1 1 1 
1 1 | Py excepitype i 
1 
1 1 1 
1 1 carly 
T 
1 上 l 
1 1 1 
I I 
ia 1 1D ID/EX EX EX/MEM MEM/WB 
flush Aush LLM 
ia excepttype_o HP id_excepttype excepttype_o | DI ex_excepttype sat m 
kake current_inst_addr_o H id_current inst addr current_inst_addr_o HP ex curent inst address rel = 
is in delayslot o |— ex is in delayslot dai LLbit_peg.v 
MEM ce 
a if id mem_excepuype [Hof excepitype i cpl epe o 
Pe Peg: 1 ex excepuype |p excepttype_i mes inst_address [Pe] currer ass i 
| ex_current_inst_addr |p} current inst addr i > CPO 
1 id_exy ex a excepttype i 
1 1 >} cp0_status i ars 
| id.v 1 —| o—l is_in_delayslot_i 
1 
| 1 
1 
| 1 bye Fy [ELS Ei] pO reg y 
! I PL wb_cp0 reg data 
1 1 mem.y 
i 3 1 
1 1 
1 | 1 
1 
y4 1 +X fl an ro un 
取 指 i Pe | 执行 访 存 | 回 写 
1 
1 1 


图 11-9 ”为 实现 异常 处 理 而 对 OpenMIPS 系 统 结构 所 做 的 修改 


(1) 流水 线 译 码 阶段 ID 模块 会 判断 是 否 是 系统 调用 指令 syscall、 
异常 返回 指令 eret、 无 效 指令 ， 将 这 些 信息 通过 excepttype_o 接 口传 递 
到 执行 阶段 ， 同 时 ， 还 将 指令 地 址 通过 current_inst_addr_o 接 口传 递 到 
执行 阶段 。 


(2) 流水 线 执行 阶段 EX 模块 会 进一步 判断 是 否 有 自 陷 异 常 ， 或 
者 溢出 异常 。 这 些 信息 会 融合 到 译 码 阶段 给 出 的 异常 信息 中 (通过 EX 
模块 的 excepttype_i 接 口传 入 ) ， 然 后 通过 excepttype_o 接 口传 递 到 访 存 
阶段 。 同 时 ， 通 过 current_inst_addr_o 接 口 将 指令 地 址 传递 到 访 存 阶 
段 ， 通 过 is_in_delayslot_o 接 口 指 出 指令 是 否 位 于 延迟 槽 中 ， 该 信息 也 
被 传递 到 访 存 阶段 。 


(3) 流水 线 访 存 阶段 MEM 模 块 会 依据 传递 过 来 的 异常 类 型 
excepttype_i, Cause 寄 存 器 的 值 (通过 cp0_cause i 接口 输入 ) ~ Status 
寄存 器 的 值 (通过 cp0_status i 接口 输入 ) ， 综 合 判 断 是 否 需要 处 理 异 
常 ， 如 果 需 要 处 理 ， 那 么 最 终 的 异常 类 型 会 通过 excepttype_o 接 口 庆 入 
CTRL 模 块 ，CTRL 模 块 据 此 给 出 异常 处 理 入 口 地 址 (通过 new_pc 接 口 
送 至 PC) 。 


(4) 如 果 要 处 理 异常 ， 那 么 还 需要 修改 协 处 理 器 CP0 中 EPC、 
Status, Cause 等 青 存 器 的 值 ， 所 以 访 存 阶段 给 出 的 最 终 的 异常 类 型 还 
要 通过 excepttype_o 接 口 送 入 CP0 模 块 ， 同 时 送 入 的 还 有 发 生 异 常 的 指 
令 是 否 在 延迟 槽 中 (通过 is_in_delayslot_ i 接口 送 入 ) 、 发 生 异 常 的 指 
令 的 地 址 〈 通 过 current inst_address_o 接 口 送 入 ) 。CP0 模 块 依据 这 些 
言 息 修 改 相 应 寄存 器 的 值 。 


(5) 如 果 要 处 理 异 常 ， 那 么 还 需要 清除 流水 线 上 除 回 写 阶段 外 的 
所 有 寄存 器 的 值 ，CTRL 模 块 通过 送出 flush 信 号 实现 此 目的 。 从 图 11-9 


可 知 ，flush 信 号 送 到 PC、IF/ID、ID/EX、EX/MEM、MEM/WB 等 模 
块 ， 会 将 这 些 模 块 中 的 寄存 器 置 为 初始 值 。 


(6) 在 第 9 章 实 现 1、sc 指 令 的 时 候 引 入 了 LLbit 寄 存 器 ， 当 ]1 指 令 
执行 的 时 候 会 设置 LLbit 为 1， 当 sc 指令 执行 的 时 候 ， 会 检查 该 寄存 器 
是 否 为 1， 如 果 为 1 就 正常 执行 ; 如 果 为 0， 那 么 认为 出 现 了 干扰 ， 不 进 
行 存储 操作 。 出 现 干 扰 的 原因 之 一 就 是 在 1、sc 指 令 之 间 产 生 了 异常 ， 
所 以 在 异常 处 理 过 程 中 会 多 进行 一 步 操 作 ， 就 是 将 LLbit 寄 存 器 置 为 
0。 这 也 是 图 11-9 中 LLbit 模 块 也 有 flush 信 号 输入 的 原因 。 


11.6 ”修改 OpenMIPS 以 实现 异常 
处 理 


11.6.1 ”修改 取 指 阶段 


1. 修改 PC 模块 
从 图 11-9 可 知 ，PC 模 块 会 增加 部 分 接口 ， 如 表 11-3 所 示 。 


711-3 ”PC 模块 增加 的 接口 


i Nit 
1 h 1 傅 


i 
ne 输入 流水 线 清除 信号 


2 new_pc E 1p 异常 处 理 例 程 入 口 地 址 


PC 模块 的 代码 修改 如 下 ， 修 改 部 分 使 用 加 粗 、 斜 体 强调 。 完 整 代 
码 请 参考 本 书 附带 光盘 Code\Chapter11 目 录 下 的 pc_reg.v 文 件 。 


2. 修改 IF/ID 模 块 
从 图 11-9 可 知 ，IF/ID 模 块 也 要 增加 部 分 接口 ， 如 表 11-4 所 示 。 
表 11-4 IF/ID 模 块 增加 的 接口 


tf W 
流水 线 清除 信号 


IF/ID 模 块 的 代码 修改 如 下 ， 修 改 部 分 使 用 加 粗 、 科 体 强 调 。 完 整 
代码 请 参考 本 书 附 带 光盘 中 Code\Chapter11 目 录 下 的 if_id.v 文 件 。 


end else if(stall[1] == "NoStop) begin 
id_pc <= if_pc; 
id_inst <= if_inst; 

end 


end 


endmodule 


11.6.2 ”修改 译 码 阶段 


1. 修改 ID 模 块 


从 图 11-9 可 知 ， 译 码 阶段 ID 模块 也 要 增加 部 分 接口 ， 如 表 11-5 所 
To 


711-5 ”ID 模块 增加 的 接口 


eee 


收集 的 异常 信息 
cita des le 泽 码 阶段 指令 的 地 址 
译 码 阶段 DD 模 块 要 增加 对 自 陷 指令 、 系 统 调用 指令 syscall、 异 常 
返回 指令 eret 的 译 码 过 程 ， 首 先 要 确定 是 哪 一 种 指令 ， 确 定 指 令 的 过 程 
如 图 11-10 所 示 。 其 中 对 eret 指 令 的 确定 比较 特别 ， 是 直接 将 指令 与 宏 
定义 EXE_ERET 比 较 ， 如 果 相 等 ， 那 么 就 是 eret 指 令 。 


op 


inst 


= EXE_SPECIAL_INST EXE_TEQ 
> op3 > teq 指 令 
=EXE_TGE 
= tge 指 令 
=EXE_TGEU 
=EXE_REGIMM_INST =EXE_TEQI - tgeu 指 令 
>» op4 = > teqi 指 令 =EXE_TLT 
-EXE_TGEI > tle 
tige -EXE_TLTU 
EXE_TGEIU, ein > tltu 指 令 
一 一 一 > tgeiu 指 令 | |-EXE_TNE 
SEXE EBEN LES = > tne 指 令 
>| eret 指 仿 lt =EXE_SYSCALL 
- er = > syscall 指 令 
= Er ttiu 指 令 > ...... 
wire[5:0] op = inst_i[31:26]; =EXE_TNEI , tneif > 
wire[5:0] op3 = inst_i[5:0]; 
wire[4:0] op4 = inst_i[20:16]; Lo e 


图 11-10 ”确定 自 陷 指令 、syscall 指 令 、eret 指 令 的 过 程 


其 中 涉及 的 安定 义 如 下 ， 在 本 书 附带 光盘 中 Code\Chapter11 目 录 下 


的 defines.v 文 件 中 可 以 找到 这 些 定 义 。 


ID 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 位 于 本 书 光 盘 
Code\Chapter11 目 录 下 的 id.v 文 件 。 


7r E 


变量 excepttype_o 收 集 译 码 阶 段 得 到 的 异常 信息 ， 其 第 8bit 表 示 是 
否 是 syscall 指 令 引 起 的 系统 调用 异常 ， 第 9bit 表 示 是 否 是 无 效 指令 引起 


的 异常 ， 


第 12bit 表 示 是 否 是 返回 指令 eret。 


译 码 工作 主要 是 确定 要 写 的 目的 寄存 器 、 要 读 取 的 寄存 器 、 要 执 
行 的 运算 三 个 方面 信息 。 对 其 中 几 个 典型 指令 的 译 码 过 程 说 明 如 下 ， 


其 余 指 令 


的 译 码 过 程 可 以 参考 这 几 个 典型 指令 。 


(1) teq 指 令 


要 瑟 的 目的 寄存 器 : teq 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设置 
wreg_0 为 WriteDisableo 

要 读 取 的 寄存 器 : teq 指 令 需 要 读 取 地 址 为 rs、rt 的 通用 寄存 
器 的 值 ， 所 以 设置 regl_read_o、reg2_read_o 为 1。 默 认 通 过 
Regfile 模 块 读 端 口 1 读 取 的 寄存 器 地 址 regl_addr_ o 是 指令 的 
21-25bit ， 正 是 teq 指 令 中 的 rs (参考 图 11-4) ， 默 认 通 过 
Regfile 模 块 读 端 口 2? 读 取 的 寄存 器 地 址 reg2_addr_o 是 指令 的 第 
16-20bit， 正 是 teq 指 令 中 的 rt (参考 图 11-4) 。 所 以 最 终 译 码 
阶段 的 输出 regl_o 就 是 地 址 为 rs 的 寄存 器 的 值 ，reg2_o 就 是 地 
址 为 rt 的 寄存 器 的 值 。 

要 执行 的 运算 : 因为 teq 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设置 
alusel_o 为 


EXE_RES_NOP。 另 外 ， 设 置 aluop_o 为 EXE_TEQ_OP， 表 示 运 算 
子 类 型 是 teq。 tlt、tge、tgeu、tttu、tne 指 令 的 译 码 过 程 可 以 参考 tedq 指 


(2) teqi 指 令 


。 要 写 的 目的 寄存 器 : teqi 指 令 不 需要 写 通用 寄存 器 ， 所 以 设置 
wreg_0oWriteDisableo 

要 读 取 的 寄存 器 : teqi 指 令 需 要 读 取 地 址 为 rs 的 通用 寄存 器 的 
值 ， 所 以 设置 regl_read_o 为 1。 默 认 通 过 Regtfile 模 块 读 端口 1 
读 取 的 寄存 器 地 址 reg1l1_addr_o 是 指令 的 第 21-25bit， 正 是 teqi 
指令 中 的 rs (参考 图 11-4) 。 设 置 reg2_read_o 为 0， 暗 含 使 用 
立即 数 作为 运算 的 操作 数 。imm 就 是 指令 中 的 立即 数 进行 符 
号 扩展 后 的 值 。 所 以 最 终 译 码 阶段 的 输出 reg1_o 就 是 地 址 为 rs 
的 通用 寄存 器 的 值 ，reg2_o 就 是 imm 的 值 。 

要 执行 的 运算 : 因为 teqi 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设置 
alusel_o 为 


EXE_RES_NOP。 另 外 ， 设 置 aluop_o 为 EXE_TEQI_OP， 表 示 运 算 
子 类 型 是 teqi。 tli、tgei、tgeiu、tltiu、tnei 指 令 的 译 码 过 程 可 以 参考 


teqi 指 令 。 
(3) syscall 指 令 


。 要 写 的 目的 寄存 器 : syscall 指 令 不 需要 与 通用 寄存 器 ， 所 以 
设置 wreg_o 为 WriteDisable。 

。 要 读 取 的 寄存 器 : syscall 指 令 不 需要 读 取 通 用 寄存 器 的 值 ， 
所 以 设置 regl_read_o、reg2_read_o 为 0。 

。 要 执行 的 运算 : 因为 syscall 指 令 不 需要 写 通 用 寄存 器 ， 所 以 
设置 alusel 0 为 EXE_RES_NOP。 另 外 ， 设 置 aluop_o0 为 


EXE_SYSCALL_OP， 表 示 运 算 子 类 型 是 syscall。 
e 此外， 设置 变量 excepttype_is_syscall 的 值 为 True， 表 示 当 前 


异常 类 型 是 系统 调用 异常 。 
(4) eret 指 令 


要 瑟 的 目的 寄存 器 : eret 指 令 不 需要 写 通 用 寄存 器 ， 所 以 设置 

wreg_0 为 WriteDisableo 

。 要 读 取 的 寄存 器 : eret 指 令 不 需要 读 取 通 用 寄存 器 的 值 ， 所 以 
设置 regl_read_o、reg2_read_o 为 0。 

。 要 执行 的 运算 : 因为 eret 指 令 不 需要 写 通用 寄存 器 ， 所 以 设置 
aluselo 为 EXE_RES NOP. 另外 ， 设 置 auopo 为 
EXE_ERET_OP， 表 示 运 算 子 类 型 是 eret。 

e 上 此外， 设置 变量 excepttype_is_eret 的 值 为 True， 表 示 当 前 执行 

的 是 返回 指令 ， 也 可 以 认为 当前 异常 类 型 是 返回 异常 。 


2。 修 改 ID/EX 模 块 
从 图 11-9 可 知 ，ID/EX 模 块 需要 增加 部 分 接口 ， 如 表 11-6 所 示 。 


711-6 ”ID/EX 模 块 增加 接口 的 描述 


接口 名 输入 /输出 作 


flush 输入 流水 线 清除 信和 号 


id excepttype 3 译 码 阶段 收集 到 的 异常 信息 


id current inst addr | 3 译 码 阶段 指令 的 


ex_excepttype 32 译 码 阶段 收集 到 的 异常 信息 


ex current inst addr | 3 执行 阶段 指令 的 地 址 


ID/EX 模 块 的 代码 主要 修改 如 下 ， 完 整 代 码 可 以 参考 本 书 附带 光 
盘 中 Code\Chapter11 目 录 下 的 id_ex.v 文 件 。 


ex_excepttype <= id_excepttype; 
ex_current_inst_address <= 


id_current_inst_address; 


end 


end 


endmodule 
上 述 代码 主要 修改 的 地 方 如 下 。 


。 在 有 流水 线 清除 事件 时 〈 即 ftush 为 1) ， 将 ID/EX 模 块 中 的 所 
有 寄存 器 设置 为 初始 值 。 

。 在 没有 流水 线 清 除 事 件 〈 即 flush 为 0) ， 并 且 译 码 阶段 没有 暂 
停 的 情况 下 《〈 即 stall[2] 为 NoStop ) ， 将 译 码 阶段 得 到 的 异常 
信息 id_excepttype、 指令 地 址 id_current_inst_address 传 递 到 执 
行 阶段 。 


11.6.3 ”修改 执行 阶段 


1. 修改 EX 模 块 


EX 模块 接收 从 译 码 阶段 传递 过 来 的 信息 ， 同 时 ， 还 要 进一步 判断 
是 否 有 目 陷 异 单 ， 或 者 溢出 异 单 发生。 从 图 11-9 可 知 ，EX 模 块 需要 增 


加 部 分 接口 ， 如 表 11-7 所 示 。 


表 11-7 EX 模块 增加 的 接口 


| 泽 码 阶段 收集 到 的 异常 信息 
执行 阶段 指令 的 地 址 


译 码 阶段 、 执 行 阶段 收集 到 的 异常 信息 


COS eer |» S ETE 
ESOS EST cor iOO ECT ENTE, 


EX 模块 的 代码 主要 修改 如 下 ， 完 整 代 码 可 以 参考 本 书 附带 光盘 中 
Code\Chapter11 目 录 下 的 ex.v 文 件 。 


// result_sum 就 是 减法 运算 的 结果 
// Cc. 如 果 是 比较 运算 或 有 符号 自 陷 指令 ， 此 时 reg2_i_mux 也 等 于 reg2_i 


// 的 补 码 ， 所 以 result_sum 也 是 减法 运算 的 结果 ， 可 以 通过 判断 减法 
// 的 结果 是 否 小 于 零 ， 进 而 判断 第 一 个 操作 数 reg1_ i 是 否 小 于 第 二 个 操 
// 作 数 reg2_i 


assign result_sum = regi_i + reg2 1 mux; 


// (3) 计算 是 否 溢出 ， 加 法 指令 add、addi、 减 法 sub 指 令 执行 的 时 候 ， 
// 需要 判断 是 否 溢出 ， 满 足以 下 两 种 情况 之 一 时 ， 有 溢出 

// A. reg1 i 为 正 数 ，reg2 i _mux 为 正 数 ， 但 是 两 者 之 和 为 负数 
// B. reg1 i 为 负数 ，reg2_i_mux 为 负数 ， 但 是 两 者 之 和 为 正 数 


assign ov_sum = ((!reg1_ i[31] && 1reg2 i mux[31]) && 
result_sum[31]) 

||((reg1_1[31] && reg2 i mux[31]) && 
(!result_sum[31])); 


// (4) 计算 操作 数 1 是 否 小 于 操作 数 2， 分 两 种 情况 


// A. 当前 指令 为 有 符号 比较 指令 或 者 有 符号 自 陷 异常 指令 的 时 候 ， 此 时 又 分 
3 种 情况 


// A1. reg1 i 为 负数 、reg2 i 为 正 数 ， 显 然 reg1_ i 小 于 reg2_ i 

// A2. reg1 i 为 正 数 、reg2 i 为 正 数 ， 并 且 reg1 i 减 去 reg2_i 的 值 
小 于 0 

// ( 即 result_sum 为 负 ) ， 此 时 也 有 reg1_i 小 于 reg2_i 

// A3. reg1 i 为 负数 、reg2 i 为 负数 ， 并 且 reg1 i 减 去 reg2_ i 的 值 
小 于 0 

// ( 即 result_sum 为 负 ) ， 此 时 也 有 reg1 i 小 于 reg2_ i 


an B. 当前 指令 为 无 符号 比较 指令 或 者 无 符号 自 陷 异 党 指令 的 时 候 ， 直 接 使 
用 比较 运算 符 


77 比较 reg1_i 与 reg2 i 
assign regi_lt_reg2 = ((aluop_i == EXE SLT OP) | | 
(aluop_i == ~EXE_TLT_OP) | | 
(aluop_i == “EXE TLTI OP) || 
(aluop_i == ~EXE_TGE_OP) | | 
(aluop_i == ~EXE_TGEI_OP)) ? 


((reg1_i[31] && !reg2 i[31]) || 
(!reg1_i[31] && !reg2 i[31] && 
result_sum[31]) | | 
(reg1_i[31] && reg2_i[31] && 
result_sum[31])) 


: (reg1 i < reg2 i); 


end 


endmodule 
上 述 代码 可 以 分 为 三 段 理解 。 


(1) 第 一 段 : 计算 出 如 下 几 个 变量 的 值 。 


reg2 i_mux: 如 果 是 减法 运算 、 有 符号 比较 运算 、 有 符号 目 
陷 指 令 ， 那 么 reg2_i_mux 等 于 第 二 个 操作 数 reg2_i 的 补 码 ， 否 
则 reg2_i_mux 就 等 于 reg2_i。 

result_sum: 第 一 个 操作 数 reg1 ji 与 第 二 个 操作 数 reg2_i 相 加 的 
结果 ， 或 者 第 一 个 操作 数 reg1 i 与 第 二 个 操作 数 reg2_i 相 减 的 
结果 。 

ov_sum: 指示 加 、 减 法 是 否 溢出 。 


regl_lt_reg2: 操作 数 1 是 否 小 于 操作 数 2。 


(2) BIR: 判断 是 否 满 足 自 陷 异常 的 条 件 ， 从 而 确定 变量 
trapassert 的 值 。 以 tge 指 令 为 例 ， 如 果 regl_lt_reg2 为 0， 即 不 是 操作 数 1 
小 于 操作 数 2， 那 么 一 定 是 操作 数 1 大 于 等 于 操作 数 2， 此 时 满足 tge 指 


令 的 条 件 ， 会 发 生 自 陷 异常 ， 从 而 设置 变量 trapassert 为 TrapAssert， 表 
示 上 自 陷 异常 发 生 。 


(3) BER: 判断 是 否 满足 溢出 异常 的 条 件 ， 从 而 确定 变量 
ovassert 的 值 。 在 add、addi、sub 指 令 的 执行 过 程 中 ， 如 果 发 生 洲 出 
(ov_sumA1) ， 那 么 会 引起 溢出 异常 ， 设 置 变 量 ovassert 为 1， 表 示 洲 
出 异常 发 生 。 


在 执行 阶段 收集 的 异常 信息 与 译 码 阶段 收集 的 异常 信息 一 起 通过 
接口 excepttype_o 传 递 到 访 存 阶段 ， 其 中 第 10bit 表 示 是 否 有 自 陷 异 常 ， 
第 11bit 表 示 是 否 有 浇 出 异常 ， 参 考 上 面 代 码 中 对 excepttype_0 的 赋值 。 

同时 传递 到 访 存 阶 段 的 还 有 指令 地 址 、 是 否 是 延迟 槽 指令 等 信 
息 ， 从 图 11-3 可 知 ， 当 异常 发 生 时 ， 这 两 个 信息 用 来 确定 保存 到 EPC 
寄存 器 的 值 。 

2. 修改 EX/MEM 模 块 


EX/MEM 模 块 接收 从 EX 模块 送 入 的 信号 ， 将 其 传递 到 访 存 阶段 ， 
从 图 11-9 可 知 ，EX/MEM 模 块 需要 增加 如 表 11-8 所 示 的 接口 。 


表 11-8 EX/MEM 模 块 新 增 接口 的 描述 


flush 流水 线 清除 信和 号 


ex_excepttype 3 译 码 、 执 行 阶 段 收集 到 的 异常 信息 


ex current inst address E 执行 阶段 指令 的 地 址 


ex is in delayslot 执行 阶段 的 指令 是 侣 是 延迟 槽 指令 


mem_excepttype 2 译 码 、 执 行 阶段 收集 到 的 异常 信息 


a in + w N 一 


6 mem current inst address | 3 访 存 阶 段 指令 的 地 址 


7 


EX/MEM 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 位 于 本 书 附带 光盘 
中 Code\Chapter11 目 录 下 的 ex_mem.v 文 件 中 。 


上 述 代码 主要 修改 的 地 方 如 下 。 


。 在 有 流水 线 清除 事件 时 ( 即 flush 为 1) ， 将 EX/MEM 模 块 中 的 
所 有 寄存 器 设置 为 初始 值 。 

。 在 没有 流水 线 清除 事件 〈 即 flush 为 0) ， 并 上 且 执行 阶段 没有 暂 
停 的 情况 下 ( 即 stall[3] 为 NoStop) ， 将 执行 、 译 码 阶段 收集 
到 的 & & ER ex_excepttype 、 指令 地 Ht 

exe 


ex_current_inst_address、 是 否 是 延迟 槽 指令 ex_is_in_delayslot 


等 信息 传递 到 访 存 阶 段 。 


11.6.4 ”修改 访 存 阶 段 


1. 修改 MEM 模 块 


OpenMIPS 处 理 器 会 在 访 存 阶段 的 MEM 模 块 综合 所 有 的 异常 信 
息 、CP0 寄 存 器 的 值 ， 最 终 判 断 是 否 有 要 处 理 的 异常 。 参 考 图 11-9 可 
知 ，MEM 模 块 要 增加 部 分 接口 ， 新 增 接口 的 描述 如 表 11-9 所 示 。 


表 11-9 ”MEM 模块 增加 的 接口 


2 Sommi |» [mr oren 
[nina A | RS 
EMO | mA vo so Wi | 
me [2 [ir EAST 
CONOS ET o [ir TT 


Tre JJ TT TT 
EEES A TT 
D [emme | [mr TT 
fo Senee |e [mn [mamma — | 
人 eumm ins anne [12 jan [nommen | 

indy [1 mm TIT TT TT 


MEM 模 块 的 代码 主要 修改 如 下 ， 完 整 代码 可 以 参考 本 书 光 盘 中 
Code\Chapter11 目 录 下 的 mem.v 文 件 。 


要 与 
// 入 的 值 就 是 Status 寄 存 器 的 最 新 值 ， 反 之 ， 从 CP0 模 块 通过 cp9_status i 
接口 
// 传 入 的 数据 就 是 Status 寄 存 器 的 最 新 值 
always @ (*) begin 
if(rst == “RstEnable) begin 
cp0_status <= ~ZeroWord; 
end else if((wb_cp0_reg_we == "WriteEnable) && 
(wb_cp0_reg_write_addr == "CPO_REG_STATUS ))begin 
cp0_status <= wb_cp0_reg_data; 
end else begin 
cp0_status <= cp0_status_i; 
end 


end 


// 得 到 CP9 中 EPC 寄 存 器 的 最 新 值 ， 步 骤 如 下 : 

// 判断 当前 处 于 回 写 阶段 的 指令 是 否 要 写 CP9 中 EPC 寄 存 器 ， 如 果 要 写 ， 那 么 要 
EN 

// 的 值 就 是 EPC 寄 存 器 的 最 新 值 ， 反 之 ， 从 CP9 模 块 通过 cp9_epc_i 接 口传 入 的 


// 据 就 是 EPC 寄 存 器 的 最 新 值 
always @ (*) begin 
if(rst == “RstEnable) begin 
cp0_epc <= "ZeroWord; 
end else if((wb_cp0_reg_we == "WriteEnable) && 
(wb_cp0_reg_write_addr == "CPO_REG_EPC 


))begin 


assign mem_we_o = mem_we & (~(|excepttype_o)); 


endmodule 
上 述 代码 可 以 分 为 三 段 理解 。 


(1) 第 一 段 : 从 CP0 模 块 传 入 的 Status、EPC、Cause 等 寄存 器 的 
值 并 不 一 定 是 最 新 值 ， 因 为 处 于 回 写 阶段 的 指令 可 能 要 写 这 些 寄存 
器 ， 此 处 又 是 一 种 数据 相关 的 情况 ， 在 之 前 已 多 次 遇 到 ， 解 决 方法 都 
是 一 样 的 一 一 将 数据 前 推 。 这 里 就 是 将 回 写 阶段 要 写 的 CP0 寄 存 器 的 
言 息 前 推 到 访 存 阶段 ， 在 访 存 阶 段 进行 判断 ， 从 而 得 到 Status、EPC、 
Cause 寄 存 器 的 最 新 值 。 以 Status 寄 存 器 为 例 ， 首 先 判断 当前 处 于 回 写 
阶段 的 指令 是 否 要 写 CP0 中 Status 寄 存 器 ， 如 果 要 写 ， 那 么 要 与 入 的 值 
(Bllwb_cp0_reg_data) 就 是 Status 寄 存 器 的 最 新 值 ， 反 之 ， 从 CP0 模 块 
传 入 的 数据 (Blcp0_status_i) 就 是 Status 寄 存 器 的 最 新 值 。 


(2) 第 二 段 : 依据 CP0 中 寄存 器 的 值 ， 以 及 译 码 、 执 行 阶段 收集 
到 的 异常 类 型 ， 得 到 最 终 的 异常 类 型 。 首 先 判断 当前 处 于 访 存 阶段 指 
令 的 地 址 是 否 为 0%， 如 果 为 0， 那 么 表示 处 理 器 处 于 复位 状态 ， 或 者 刚 
刚 发 生 异 常 ， 正 在 清除 流水 线 (flush 为 1) ， 或 者 流水 线 处 于 暂停 状 
态 ， 在 这 三 种 情况 下 都 不 处 理 异常 。 


如 果 当 前 处 于 访 存 阶段 指令 的 地 址 不 为 0， 那 么 可 以 进一步 判断 有 
没有 异常 、 是 何 种 异常 ， 从 而 给 输出 变量 excepttype_o 冉 值 。 各 种 异常 
的 判断 依据 列举 如 下 ， 判 断 过 程 如 图 11-11 所 示 。 


异常 信息 


< HERE? > > excepttype_o = 32'h00000001 


不 
| A 


LE 系统 Nsyscall? — > excepttype_o = 32'h00000008 


AS 
[x 


a T 效 指令 ? = > excepttype_o = 32'h0000000a 


Ra 


<A? > excepttype_o = 32h0000000d 


= Mee? > > excepttype_o = 32'h0000000c 


异常 返 到 en > excepttype_o = 32'h0000000e 


图 11-11 异常 类 型 的 判断 过 程 


。 发 生 中 断 的 依据 是 :Cause 寄存 器 的 IP 字 段 不 为 0， 且 Status 寄 
存 器 中 相应 的 中 断 掩 码 字段 IM 也 不 为 0， 另 外 ，Status 寄 存 器 
的 EXL 字 段 为 0， 表 示 不 处 于 异常 处 理 过 程 中 ，Status 寄 存 器 
表示 中 断 使 能 。 

。 发生 系 统 调用 异常 的 依据 是 : 输入 的 异常 类 型 excepttype i 的 
第 8bit 为 1， 因 可 以 参考 11.6.2 节 译 码 阶 段 中 syscall 指 令 
的 译 码 过 程 。 


。 发 生 无 效 指令 异常 的 依据 是 : 输入 的 异常 类 型 excepttype_i 的 
第 9bit 为 1， 具 体 原 因 可 以 参考 11.6.2 节 译 码 阶段 。 

。 发 生 自 陷 异 常 的 依据 是 : 输入 的 异常 类 型 excepttype i 的 第 
10bit 为 1， 具 体 原因 可 以 参考 11.6.3 节 执行 阶段 对 自 陷 指令 的 
处 理 过 程 。 

。 发 生 洪 出 异常 的 依据 是 : 输入 的 异常 类 型 excepttype i 的 第 
11bit 为 1， 具 体 原 因 可 以 参考 11.6.3 节 执行 阶段 对 溢出 情况 的 
处 理 过 程 。 

。 人 确定 是 异常 返回 指令 eret 的 依据 是 : 输入 的 异常 类 型 
excepttype_i 的 第 12bit 为 1， 具 体 原 因 可 以 参考 11.6.2 节 译 码 阶 
段 中 eret 指 令 的 译 码 过 程 。 


(3) 第 三 段 : OpenMIPS 处 理 器 要 实现 精确 异常 ， 也 就 是 发 生 异 
常 时 ，5| 起 异常 的 指令 及 其 后 面 已 经 进入 流水 线 的 指令 都 会 失效 。 如 
果 引 起 异常 的 指令 是 存储 指令 ， 那 么 要 使 其 失效 ， 就 要 停止 修改 数据 
存储 器 ， 所 以 在 这 里 修改 mem_we_o 的 赋值 ， 如 果 发 生 异 常 (BEE 
excepttype_o 不 为 0) ， 那 么 设置 mem_we_o 为 0， 从 而 不 会 修改 数据 存 
储 器 。 


2. 修改 MEM/WB 模 块 


MEM/WB 模 块 接收 来 自 MEM 模 块 的 信和 号， 将 其 传递 到 回 写 阶 
段 ， 从 图 11-9 可 知 ，MEM/WB 模 块 需要 增加 如 表 11-10 所 示 的 接口 。 


表 11-10 MEM/WB 模 块 新 增 接口 的 描述 


| 序 s| 接口 名 | we | mams 
a 


oo fe | 


MEM/WB 模 块 的 代码 主要 修改 如 下 ， 完 整 代 码 位 于 本 书 附 带 光 盘 
中 Code\Chapter11 目 录 下 的 mem_wb.v 文 件 内 。 


wb_whilo <= ‘WriteDisable; 


wb_LLbit_we <= 1 bo; 
wb_LLbit_value <= 1'b0; 
wb_cp0_reg_we <= "WriteDisable; 


wb_cp0_reg_write_addr <= 5'b00000; 


wb_cp0_reg_data <= "ZeroWord; 


endmodule 


如 果 发 生 了 异常 ， 导 致 fush 信 号 为 1， 那 么 会 放弃 对 通用 寄存 器 
HI、LO、LLbit 以 及 CP0 中 寄存 器 的 修改 ， 目 的 是 不 对 处 理 器 产生 任何 
影响 。 


11.6.5 ”修改 协 处 理 器 CP0 


参考 图 11-9 可 知 ， 访 存 阶 段 的 一 些 输出 会 送 入 CP0 模 块 ， 用 来 确定 
CP0 中 部 分 寄存 器 的 值 。CP0 模 块 要 增加 的 接口 如 表 11-11 所 示 。 


表 11-11 ”CP0 模 块 新 增 接口 的 描述 


CP0 模 块 的 代码 主要 修改 如 下 ， 完 整 代 码 请 参考 本 书 附带 光盘 中 
Code\Chapter11 目 录 下 的 cp0_reg.v 文 件 。 


上 述 代 码 主要 是 依据 访 存 阶段 给 出 的 最 终 异 党 类 型 ， 进 而 修改 
CP0 中 相应 寄存 器 的 值 。 不 同 异常 类 型 修改 的 值 也 不 同 ， 依 次 介绍 如 
下 。 


1. 中断 


依据 发 生 异 常 的 指令 是 否 位 于 延迟 槽 中 ， 设 置 FPC 寄 存 器 的 值 ， 
以 及 Status 寄 存 器 的 BD 字 段 ， 如 果 位 于 延迟 槽 中 ， 那 么 设置 FPC 寄存 
器 为 上 一 条 指令 的 地 址 ，Status 寄 存 器 的 BD 字 段 为 1， 反 之 ， 设 置 EFPC 
寄存 器 为 发 生 异 常 指 令 的 地 址 ，Status 寄 存 器 的 BD 字 段 为 0。 另 外 ， 设 
置 Status 寄 存 器 的 EXL 字 段 为 1， 表 示人 处 于 异常 级 ， 中 断 禁 止 。 最 后 ， 
设置 Cause 寄 存 器 的 ExcCode 字 段 为 5b00000， 表 示 异 常 原因 是 中 断 ， 
参考 第 10 章 的 表 10-7。 


2。 系 统 调用 异常 
分 两 种 情况 。 


(1) 如 果 Status 寄 存 器 的 EXL 字 段 为 0， 那 么 依据 发 生 异 常 的 指令 
是 否 位 于 延迟 槽 中 ， 设 置 EFPC 寄 存 器 的 值 ， 以 及 Status 寄 存 器 的 BD 字 
段 。 如 果 位 于 延迟 槽 中 ， 那 么 设置 FPC 寄存 器 为 上 一 条 指令 的 地 址 ， 
Status 寄 存 器 的 BD 字段 为 1， 反 之 ， 设 置 EPC 寄 存 器 为 发 生 异 常 指 令 的 
地 址 ，Status 寄 存 器 的 BD 字 段 为 0。 然 后 ， 设 置 Status 寄 存 器 的 EXL 字 
段 为 1， 表 示 处 于 异常 级 ， 中 断 禁 止 。 最 后 ， 设 置 Cause 寄 存 器 的 
ExcCode 字 段 为 5b01000， 表 示 异 常 原因 是 系统 调用 指令 syscall， 参 考 
第 10 章 的 表 10-7。 


(2) 如 果 Status 寄 存 器 的 EXL 字 段 为 1， 表 示 当 前 已 经 处 于 异常 级 
了 ， 又 发 生 了 新 的 异常 ， 那 么 只 需要 将 异常 原因 保存 到 Cause 寄 存 器 的 


ExcCode 字 段 ， 此 处 设置 为 5b01000， 表 示 异 常 原因 是 系统 调用 指令 


syscallo 
3. 无 效 指令 异常 


与 系统 调用 异常 的 处 理 过 程 类 似 ， 只 是 设置 Status 寄 存 器 的 
ExcCode 字 段 为 5b01010， 表 示 异 常 原 因 是 无 效 指 令 ， 参 考 第 10 草 的 表 
10-7。 


4. 自 陷 异 常 


与 系统 调用 异常 的 处 理 过 程 类 似 ， 只 是 设置 Status 寄 存 器 的 
ExcCode 字 段 为 5b01101， 表 示 异 常 原因 是 自 陷 ， 参 考 第 10 章 的 表 10- 
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5。 溢 出 异常 


与 系统 调用 异常 的 处 理 过 程 类 似 ， 只 是 设置 Status 寄 存 器 的 
ExcCode 字 段 为 5b01100， 表 示 异 常 原因 是 溢出 ， 参 考 第 10 章 的 表 10- 
ga 


6. 异常 返回 指令 eret 
清除 Status 寄 存 器 的 IE 字段 ， 表 示 中 断 允 许 。 


上 述 6 种 异常 的 处 理 过 程 是 与 11.3 节 异常 处 理 过 程 一 致 的 。 


11.6.6 ”修改 控制 模块 CTRL 


CTRL 模 块 会 依据 异常 类 型 ， 给 出 新 的 取 指 地 址 ( 即 : 异常 处 理 
例 程 入 口 地 址 ) ， 同 时 决定 是 否 要 清除 流水 线 。 其 新 增 接口 如 表 11-12 
所 示 ， 其 中 的 输入 信号 excepttype_i、cp0_epc_i 都 来 自 MEM 模 块 ， 读 
者 可 以 参考 图 11-9。 


表 11-12 CTRL 模块 新 增 接口 的 描述 


2 excepttype i 3 输 最 终 的 异常 类 型 
new_pc 32 输出 异常 处 理 入 口 地址 
4 flush 输出 是 否 清除 流水 线 


修改 CTRL 模块 的 代码 如 下 ， 源 文件 是 本 书 附带 光盘 
Code\Chapter11 目 录 下 的 ctrl.v 文 件 。 


module ctr1( 


input wire rst, 
input wire stallreq_from_id, 
input wire stallreq_from_ex, 


// 新 增 输入 信号 ， 来 自 MEM 模 块 
input wire[31:0] excepttype_i, 


input wire[ 'RegBus] cpo_epc_i, 


// 新 增 输出 信号 
output reg[ RegBus] new_pc, 


output reg flush, 


endmodule 


当 发 生 异 常 时 (excepttype_ i 不 为 0) ， 依 据 异 常 类 型 ， 设 置 输出 
信号 new_pc 为 异常 处 理 例 程 入 口 地 址 。 同 时 设置 输出 信号 ftush 为 1。 


对 于 指令 eret 而 言 ， 因 为 需要 返回 到 异常 发 生前 的 状态 继续 执行 ， 
所 以 设置 输出 信号 new_pc 为 EPC 寄 存 器 的 值 ( 即 cp0_epc i) o 


参考 图 11-9 可 知 ，new_pc 传 递 到 PC 模块 ， 从 11.6.1 节 对 PC 模块 的 
修改 可 知 ，new_pc 会 作为 新 的 取 指 地 址 。 


读者 如 果 耐 心地 读 到 这 里 ， 应 该 就 知道 如 何 自 定义 异常 处 理 例 程 
入 口 地 址 了 。 


11.6.7 ”修改 OpenMIPS 


最 后 ， 要 修改 OpenMIPS 模 块 ， 在 其 中 将 上 面 修改 的 模块 按照 图 
11-9 所 示 的 关系 连接 起 来 。 注 意 一 点 ， 在 前 几 章 已 实现 了 LLbit 模 块 的 
flush 接 口 、DIV 模 块 的 annul_i 接 口 ， 但 是 当时 对 这 两 个 接口 都 没有 连 
接 有 效 信和 号， 现在 可 以 连接 了 ， 就 连接 到 CTRL 模 块 的 输出 接口 
flush。 具 体 代 码 不 在 书 中 给 出 ， 读 者 可 以 参考 本 书 附带 光盘 中 
Code\Chapter11 目 录 下 的 openmips.v 文 件 。 


11.7 再 次 修改 最 小 SOPC 


在 第 9 章 ， 为 了 测试 加 载 存储 指令 是 否 实现 正确 而 修改 了 最 小 
SOPC， 本 节 将 再 次 修改 最 小 SOPC， 将 时 钟 中 断 输出 作为 一 个 中 断 信 
号 输入 ， 这 样 就 可 以 处 理 时 钟 中 断 了 ， 从 而 验证 异常 相关 指令 是 否 实 
现 正 确 。 如 图 11-12 所 示 。 


OpenMIPS 
rst timer_int_o 
clk rom ce 0 
rom_data_i rom_addr_o 
ram_data_i ram_addr_o 
—p| inti ram_data_o 
ram_sel_o 
ram We _0 
ram ce 0 


openmips.y 


图 11-12 ”再 次 修改 最 小 SOPC 以 实现 对 时 钟 中 断 的 处 理 


其 中 ， 输 入 接口 int_ i 的 宽度 为 6， 时 钟 中 断 输 出 接口 timer_int_o 连 
接 到 int_ i 的 最 低位 ， 修 改 openmips_ min_sopc 的 代码 如 下 ， 以 实现 
11-12 所 示 的 连接 ， 完 整 代码 请 参考 本 书 附带 光盘 中 Code\Chapter11 目 
录 下 的 openmips_min_sopc.v 文 件 。 


module openmips_min_sopc( 


input wire clk, 


input wire rst 


); 


118 ”测试 程序 


11.8.1 ”测试 程序 1 一 一 测试 系统 调用 
异常 


对 系统 调用 异常 的 测试 程序 如 下 所 示 ， 源 文件 是 本 书 附带 光盘 中 
Code\Chapter11\AsmTest\test1 E R FéYinst_rom.SX {Fo 


.org 0x0 

.set noat 

.set noreorder 
.set nomacro 


.global _start 


_start: 
# 因为 低地 址 有 异常 处 理 例 程 ， 所 以 处 理 器 启动 后 ， 就 立即 转移 到 6x100 处 
ori $1,$0,0x100 # (1) 设置 寄存 器 $1 = 0x100 
jr $1 # ”转移 到 地 址 9x100 处 

nop 


# 系统 调用 异常 处 理 例 程 

,Org 0x40 
ori $1,$0,0x8000 # (3) 设置 寄存 器 $1 = 0x00008000 
ori $1,$0,0x9000 # (4) 设置 寄存 器 $1 = 0x00009000 


mfcO $1, $14, 0x0 # (5) 获取 EPC 寄 存 器 的 值 保存 到 寄存 器 $1，$1 = 
©x0000010c, 

addi $1,$1,0x4 # (6) 寄存 器 $1 加 4, $1 = 0x00000110 

mtcO $1,$14, 0x0 # “将 EPC+4 的 结果 保存 回 EPC 寄 存 器 

eret 

nop 


# 主 程序 ， 在 其 中 调用 syscall 指 令 ， 从 而 引起 系统 调用 异常 
,Org 0x100 


ori $1, $0, 0x1000 # (2) 设置 寄存 器 $1 = 0x1000 


sw $1, 0x0100($0) # 将 寄存 器 $1 的 值 存 储 到 内 存 0x100 处 ， 
# [9x100] = 0x00001000 


mthi $1 # 将 寄存 器 $1 的 值 复制 到 寄存 器 HI，HI = 
0x00001000 
syscall # 调用 syscal1 指 令 ， 引 起 系统 调用 异常 


lw $1, 0x0100($0) # (7) 从 内 存 9x100 处 加 载 数据 ， 保 存 到 寄存 器 $1 
# 所以， 最 后 $1 = 0x00001000 


mfhi $2 # “将 寄存 器 HI 的 值 赋 给 寄存 器 $2 $2 = 
0x00001000 
_loop: 

j _loop 

nop 


因为 低地 址 有 异常 处 理 例 程 ， 所 以 处 理 器 启动 后 ， 就 立即 转移 到 
0x100 处 ， 随 后 调用 syscall 指 令 ，5| 起 系统 调用 异常 ， 转 移 到 0x40 处 进 
行 异常 处 理 。 在 异常 处 理 例 程 中 ， 读 出 EPC 寄 存 器 的 值 ， 将 其 加 4， 再 
保存 回 EPC 寄 存 器 ， 然 后 使 用 指令 eret 返 回 ， 继 续 执行 。 


注意 : 之 所 以 要 将 EPC 寄 存 器 加 4， 是 因为 EPC 寄 存 器 中 保存 的 是 
syscall 指 令 的 地 址 ， 如 果 不 加 4， 那 么 eret 指 令 会 使 得 程序 又 回 到 syscall 


指令 处 ， 从 而 又 引发 系统 调用 异常 ， 永 不 停止 ， ee 
4， 这 样 当 使 用 eret 指 令 会 返回 到 syscall 指 令 的 下 一 条 指令 
处 ， 从 而 避免 了 上 述 问题 。 


o a ed a 正确 实现 了 对 系统 调 
常 的 处 理 。$1 青 存 器 的 变化 顺序 在 程序 的 注释 中 已 经 注 明 。 
ModelSim 仿 真 结果 如 图 11- 13 所 示 ， 从 中 可 知 ，OpenMIPS 正 确实 现 了 
对 系统 调用 异常 的 处 理 。 


让 _pe 就 是 取 指 地 址 ， 在 这 里 变 为 0k40， 就 是 转移 到 系统 调用 异常 处 理 例 程 | 


® rst sto | 

» ck Sti Fl A EA | Se E E 
06 if_pc 000. }00000 104 {00000108 }00000 10c 00000110 }0000011400000118 }00000040 100000044; 
© reofilei/regs[1] ]000... {00000100 }00001000 


de rst sto 

de dk ee eS ee Le Lt Le IL] 
ES if_pc 000... 00000048 }0000004c }00000050 }00000054 }00000053 J0000005c }00000060 }00000110 
6-4 reafileifregs[1] |000... [00001000 0003000 如 0009600 }0000010c }00000110 


系统 调用 异常 处 理 例 程 会 修改 $1 寄 存 器 的 值 ，| -一 一 
依次 改 为 0x8000、0x9000、0x1l0c、0x110 


® rst sto 

» dk sto me ee ee ee eee ee ee ee EN 
Be if pc 000... .- 100000114 }00000118 }0000011c }00000118 }0000011c }00000113 }0000011c 10000011; 
5-4 regfileljregs[1] ]000... [00000110 0001000 


图 11-13 ”测试 程序 1 的 ModelSim 仿 真 结 果 


11.8.2 ”测试 程序 2 一 一 测试 自 陷 异常 


对 自 陷 异常 的 测试 程序 如 下 所 示 ， 源 文件 是 本 书 光盘 中 
Code\Chapter11\AsmTest\test2 目 录 下 的 inst_rom.S 文 件 。 


,Org 0x0 
.Set noat 


.Set noreorder 


.set nomacro 
.global _start 
BS tarts 
# 因为 低地 址 有 异常 处 理 例 程 ， 所 以 处 理 器 启动 后 ， 就 立即 转移 到 9x100 处 
ori $1,$0,0x100 + 设置 寄存 器 $1 = 0x100 
jr $1 # 转移 到 地 址 9x100 处 


nop 


# 自 陷 异 常 的 处 理 例 程 ， 在 其 中 设置 寄存 器 $1 的 值 


,Org 0x40 
ori $1,$0,0xf0f0 # 设置 寄存 器 $1 = OX0000fOfO 
ori $1,$0,0xffff # 设置 寄存 器 $1 = 0x0000ffff 
ori $1,$0,0x0f0f # 设置 寄存 器 $1 = 0x00000f0f 
mfcO $4,$14,0x0 # 获取 EPC 寄 存 器 的 值 ， 保 存 到 寄存 器 $4 
addi $4,$4,0x4 # 将 寄存 器 $4 加 4 
mtcO $4,$14,0x0 # 将 寄存 器 $4 的 值 赋 给 EPC， 


# 上 面 三 条 指令 实际 就 是 将 EPC 寄 存 器 的 值 加 4 


eret # 异常 返回 


nop 


# 主 程序 ， 在 其 中 会 调用 多 个 自 陷 指令 


,Org 0x100 
Ori $1,$0,0x1000 # $1 = 0x00001000 
ori $2,$0,0x1000 # $2 = 0x00001000 


teq $1, $2 # 此 时 $1 等 于 2， 所 以 发 生 自 陷 异 常 


ori $1,$0,0xa000 
tlti $1,0x9000 
FRERBRS 


ori $1, $0, 0xb000 
tltiu $1,0xb000 


ori $1,$0,0xc000 
tltu $2,$1 


ori $1,$0,0xd000 
_loop: 
j _loop 


nop 


# $1 = 0x0000a000 
# 此 时 $1 不 小 于 0xffff9000， 所 以 


+ 


$1 = 0x0000b000 
此 时 $1 小 于 0xffffb000， 所 以 发 生 自 陷 异 常 


+ 


# $1 = 0x0000c000 
此 时 $2 小 于 $1， 所 以 发 生 自 陷 异 常 


+ 


# 最 后 ， 设 置 寄存 器 $1 = 0x0000d000 


程序 一 开始 就 转移 到 地 址 0x100 处 的 主 程序 中 ， 在 主 程序 会 调用 各 
种 自 陷 指令 ， 如 果 满 足 自 陷 指令 的 条 件 ， 那 么 会 转移 到 自 陷 异常 处 理 
例 程 。 注 意 : 在 自 陷 异常 处 理 例 程 中 ， 要 将 EPC 寄 存 器 的 值 加 4， 然 后 
再 调用 指令 eret 返 回 ， 具 体 原因 在 测试 程序 1 中 已 说 明 。 


观察 寄存 器 $1 的 变化 可 以 判断 自 陷 指令 、 自 陷 异 常 处 理 是 否 实现 
正确 ， 寄 存 器 $1 的 变化 顺序 在 程序 的 注释 中 已 经 注 明 。ModelSim 仿 真 
结果 如 图 11-14、 图 11-15 所 示 ， 从 中 可 知 ，OpenMIPS 正 确实 现 了 自 陷 
各 令 、 自 陷 异常 处 理 。 


teq $1,$2 指 令 满足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 \ 


É rst sto 
® ck sto 
14 regfileifregs[1] |000... 
5-4 reafilei/regs[2} (00... 


® rst sto 

© ck sto 
BS regfileifregs[1] [000... 
1-4 regfileifregs[2] [00... 


teqi S1,0x300044 AWE FASE REAR ES PLA SARA | 


» rst sto 
® ck sto 
54 reafilei/regs[1] |000... 
54 regfilel/regs[2] |00... 


tnei $1.0X2000 指 令 满足 目 陷 异常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 | 


de rst sto 

» ck sto 
8 reafilei/regs[1] ]000... 
04 reofilei/regs[2] 00... 


54 regfileifregs[2] 00... 


dh» rst sto 

& ck sto 
154 regfilel/regs[1] [000... 
54 regfle1/regs[2] 00... 


tgeiu $1,0x7000 指 令 满 足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 


de rst sto 

db ck sti 
104 reofilei/regs[1] 000... 
0-4 regfileifregs[2] 00... 


tgeu $1,$2 指 令 满足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 | 


© ck Jara Pd 


图 11-14 ”测试 程序 2 的 ModelSim 仿 真 结 


ttt$1,$2 指 令 不 满足 自 陷 异 常 发 生 条 件 ， 所 以 没有 进入 


/| 噶 常 处 理 例 程 


® rst sto 
© dk sto 
E- regfilel/regs[1] 000... 
5-4 reafilei/regs[2] ]00... 
tlti $1,0x9000 指 令 不 满足 自 陷 异 常 发 生 条 件 ， 所 以 没有 “| 
进入 异常 处 理 例 程 


tltiu $1,0x 此 今 满 足 自 陷 异 常 发 生 条 件 ， 所 以 进入 异常 处 理 例 程 

$1,0xb000 指 令 满 足 自 陷 异常 发 生 条 件 所 以 进入 蜡 常 处 理 例 程 | 
® rst sto x 
® ck sto 

5-4 regfilel/regs[1] ]000... 

5-4 reafilet/regs[2] (00... 


® rst sto 

® ck Sti 
加 人 reofilet/regs[1] |000... 
B® regfileljregs[2] |00... 


® rst sto 
® dk sto AAA ll altra ae el el 
E-e reofilei/regs[1] (00... 0000d000 


3-4 reofilei/regs[2] foo... {00001000 


图 11-15 “测试 程序 2 的 ModelSim 仿 真 结 果 ( 续 ) 


11.8.3 ”测试 程序 3 一 一 测试 时 钟 中 断 


时 钟 中 断 的 测试 程序 如 下 所 示 ， 源 文件 是 本 书 光盘 中 
Code\Chapterl11\AsmTest\test3 目 录 下 的 inst_rom.S 文 件 。 


,Org 0x0 

.set noat 

.Set noreorder 
.Set nomacro 
.global _start 


_start: 


# 因为 低地 址 有 异常 处 理 例 程 ， 所 以 处 理 器 启动 后 ， 就 立即 转移 到 909x100 处 
ori $1, $0, 0x100 # $1 = 0x100 
Jie SSi 


nop 


# 中 断 处 理 例 程 ， 在 其 中 将 $2 寄 存 器 的 值 加 1， 这 样 便于 观察 时 钟 中 断 是 否 发 生 。 
# 另外 ， 增 加 compare 寄 存 器 的 值 ， 以 清除 时 钟 中 断 声明 ， 同 时 设置 下 一 次 时 钟 
# 中 断 发 生 的 时 间 


,Org 0x20 
addi $2,$2,0x1 # “$2 寄 存 器 的 值 加 1 
mfcO $1,$11, 0x0 # ” 读 取 Compare 寄 存 器 的 值 
addi $1,$1,100 # 增加 100 
mtcO $1,$11,0x0 # “再 保存 回 Compare 寄 存 器 
eret 
nop 


4 主 程序 ， 在 其 中 初始 化 Compare 寄 存 器 ， 并 且 使 能 时 钟 中 断 
,Org 0x100 

ori $2,$0,0x0 

ori $1,$0,100 # 

mtcO $1, $11, 0x0 # ”初始 化 compare 寄 存 器 的 值 为 100 


lui $1,0x1000 

ori $1,$1,0x401 # 

mtcO $1,$12, 0x0 # 设置 Status 寄 存 器 的 值 为 0x10000401， 表 示 使 
能 时 钟 中 断 


_loop: 
j _loop 


nop 


同 前 面 的 测试 程序 一 样 ， 程 序 一 开始 就 转移 到 0x100 处 的 主 程序 
中 ， 在 其 中 初始 化 Compare 寄 存 器 的 值 ， 设 置 为 100。 然 后 设置 Status 
寄存 器 的 值 为 0x10000401， 也 就 是 设置 其 中 的 正字 段 为 1， 表 示 中 断 使 
能 ， 同 时 设置 时 钟 中 断 对 应 的 掩 码 IM[3] 为 1， 从 而 允许 时 钟 中 断 。 然 
后 进入 一 个 循环 等 待 中 。 


当 Count 寄 存 器 的 值 等 于 Compare 寄 存 器 的 值 时 ， 会 发 生 时 钟 中 
断 ， 导 致 进入 中 断 处 理 例 程 ， 在 其 中 将 $2 青 存 器 的 值 加 1， 主 要 是 方便 
观察 仿真 结果 。 然 后 将 Compare 寄 存 器 的 值 加 100， 这 样 做 一 方面 会 清 
除 当 前 的 时 钟 中 断 声 明 ， 另 一 方面 也 设置 了 下 一 次 时 钟 中 断 的 发 生 时 
间 。 当 Count 寄 存 器 的 值 再 次 等 于 Compare 寄 存 器 的 值 时 ， 又 会 发 生 时 
钟 中 断 。 


观察 $2 寄 存 器 的 变化 可 以 知道 OpenMIPS 对 时 钟 中 断 的 处 理 是 否 实 
现 正 确 。 实 现 正 确 时 ，$2 寄 存 器 的 值 应 该 不 断 累 加 。ModelSim 仿 真 结 
果 如 图 11-16 所 示 ， 从 中 可 知 ，OpenMIPS 正 确实 现 了 对 时 钟 中 断 的 处 
理 。 


C1) 每 隔 一 段 时 间 ， 当 Count 寄 存 器 的 值 等 于 Compare 寄 存 
器 的 值 时 ， 会 声明 时 钟 中 断 ， 设 置 输出 信号 timer_int o 为 1 人 


® rst No... f| 
® ck No... 
dls timer_int_o No... N N N N 
3% compare_o No... E 100000054 }D00000c8 (00000 12c (00000190 000001f4 
E$ regfilet/regs[2] ]-No... | 一 520000000 00000001 jo0000002 00000003 _- 00000004 
- > 


pe Je 
(2) 时 钟 中 断 发 生 后 ， 会 进入 中 断 处 理 例 程 ， 在 其 中 将 Compare | pee Pa 
寄存 器 的 值 加 100〈 注 意 : 图 中 显示 的 Compare 的 值 是 十 六 进 制 ) | Pi 


4 
(3) 时 钟 中 断 发 生 后 ， 会 进入 中 断 处 理 例 程 ， | 一 
在 其 中 将 寄存 器 $2 的 值 加 1 


图 11-16 ”测试 程序 3 的 ModelSim 仿 真 结 


11.9 教学 版 OpenMIPS 处 理 器 实 
现 小 结 


好 了 ， 我 们 的 教学 版 OpenMIPS 处 理 器 已 经 完全 实现 了 ， 读 者 可 以 
回顾 一 下 ， 从 第 4 章 开 始 ， 到 第 11 章 结束 ， 我 们 首先 实现 了 一 条 简单 的 
ori 指 令 ， 通 过 该 指令 建立 了 基本 的 流水 线 结构 ， 然 后 依次 添加 实现 了 
逻辑 操作 指令 、 移 位 操作 指令 、 空 指令 、 移 动 操作 指令 、 算 术 操 作 指 
令 、 转 移 指 令 、 加 载 存 储 指令 、 协 处 理 器 访问 指令 、 异 单 相 天 指令 ， 
如 此 由 小 到 大 、 由 简单 到 复杂 ， 最 终 实 现 了 教学 版 OpenMIPS 处 理 器 。 


从 下 一 章 开 始 将 进入 本 书 第 三 部 分 一 一 进 阶 篇 ， 在 其 中 实现 了 实 
践 版 OpenMIPS 处 理 器 ， 并 与 SDRAM 控 制 器 、GPIO 模 块 、Flash 控 制 
器 、UART 控 制 器 、Wishbone 总 线 互联 和 矩阵 等 模块 组 成 一 个 小 型 
SOPC， 然 后 下 载 到 FPGA 了 片 以 验证 实现 效果 ， 最 后 ， 还 会 为 实践 版 
OpenMIPS 处 理 器 移植 腐 入 式 实 时 操作 系统 hC/OS-II。 
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第 12 章 ”实践 版 OpenMIPS 处 理 器 
设计 与 实现 


经 过 第 4 一 11 章 ， 一 步 一 步 地 完善 、 补 充 ， 最 终 实 现 了 我 们 在 第 3 
章 中 设计 的 教学 版 OpenMIPS 处 理 器 ， 但 是 教学 版 OpenMIPS 处 理 器 距 
离 实 用 还 有 一 点 差距 ， 这 也 就 是 实践 版 OpenMIPS 处 理 器 需要 解决 的 问 


题 。 


本 章 将 介绍 实践 版 OpenMIPS 处 理 器 的 设计 与 实现 ， 首 先 在 12.1 节 
给 出 了 实践 版 OpenMIPS 处 理 器 的 设计 目标 ， 重 点 说 明 实 践 版 
OpenMIPS 与 教学 版 OpenMIPS 的 区 别 ， 以 及 添加 总 线 接口 的 原因 。 接 
着 在 12.2 节 详细 说 明 Wishbone 总 线 接口 ，12.3 节 给 出 了 添加 Wishbone 总 
线 接口 后 的 实践 版 OpenMIPS 处 理 器 接口 图 。 然 后 在 12.4 节 介绍 实践 版 
OpenMIPS 处理 器 的 实现 思路 。 最 后 ， 在 12.5 节 通过 修改 教学 版 
OpenMIPS 处 理 器 的 代码 ， 实 现实 践 版 OpenMIPS 处 理 器 。 


12.1 ”实践 版 OpenMIPS 处 理 器 的 
设计 目标 


已 实现 的 教学 版 OpenMIPS 处 理 器 的 主要 设想 是 尽量 简单 ， 比 如 : 
在 一 个 时 钟 周 期 内 可 以 取 到 指令 ， 完 成 存储 、 加 载 数 据 ， 这 样 处 理 器 
的 运行 情况 〈 主 要 是 流水 线 的 运行 情况 ) 就 比较 理想 化 ， 与 教科 书 相 
似 ， 代 码 也 很 简单 清晰 ， 便 于 使 用 其 进行 教学 、 学 术 研究 和 讨论 ， 也 
有 助 于 学 生理 解 课 堂上 讲授 的 知识 。 所 以 ， 我 们 在 构建 基于 教学 版 
OpenMIPS 的 最 小 SOPC 时 ， 指 令 存储 器 ROOM、 数据 存储 器 RAM 都 可 


以 位 于 FPGA 内 部 ， 以 满足 教学 版 OpenMIPS 的 特殊 要 求 。 因 此 ， 教 学 
版 OpenMIPS 的 接口 也 比较 简单 ， 主 要 就 是 与 ROM、RAM 的 接口 。 如 
图 12-1 所 示 。 


FPGA 


OpenMIPS 


ROM RAM 


图 12-1 基于 教学 版 OpenMIPS 的 最 小 SOPC 的 结构 ， 其 指令 存储 器 ROM、 数据 存储 器 RAM 都 


位 于 FPGA 内 


但 是 在 实际 应 用 中 ， 程 序 的 体积 可 能 非常 大 ， 指 令 存储 器 就 不 能 
再 集成 在 FPGA 内 部 了 ， 一 般 使 用 FPGA 芯 片 外 部 的 Flash 作 为 指令 存储 
器 。 同 理 ， 一 般 使 用 FPGA 芯 片 外 部 的 SDRAM 作 为 数据 存储 器 ， 如 图 
12-2 所 示 。 


FPGA 


OpenMIPS 


Flash SDRAM 


图 12-2 ”实际 应 用 中 ， 指 令 存 储 器 、 数 据 存 储 器 位 于 FPGA 外 部 


因此 ， 为 了 使 openMIPS 实 用 化 ， 需 要 为 其 添加 Flash 控 制 器 、 
SDRAM 控 制 器 ， 如 图 12-3 所 示 。 


FPGA 


OpenMIPS 


Flash 控 制 器 SDRAM 控 制 器 


Flash SDRAM 


图 12-3 ”为 OpenMIPS 添 加 Flash 控 制 器 、SDRAM 控 制 器 以 使 其 实用 化 


更 进一步 ， 如 果 要 使 用 FPGA 心 片 外 部 的 SRAM， 那 么 需要 再 为 
OpenMIPS 添加 SRAM 控 制 器 ， 如 果 要 使 用 串口 ， 那 么 需要 再 为 
OpenMIPS 添 加 UART 控 制 器 。 读 者 一 定 发 现 了 一 个 问题 : 每 添加 一 个 
外 部 设备 ， 都 要 修改 OpenMIPS。 是 的 ， 图 12-3 的 做 法 不 具有 良好 的 扩 
展 性 。 


参考 一 下 常用 的 PC， 其 一 般 都 提供 PCI 总 线 接口 ， 各 种 板 卡 (E 
括 显卡 、 语 音 卡 、 网 卡 ， 甚 至 用 户 自制 的 板 卡 ) 只 要 满足 PCI 总 线 接 
口 标准 ， 就 可 以 直接 插 在 PC 的 PCI 插 槽 使 用 ， 十 分 方便 ， 并 不 需要 修 
改 处 理 器 。 借 鉴 这 种 方式 ， 我 们 只 需要 为 OpenMIPS 添 加 通用 总 线 接 
口 ， 就 可 以 方便 地 接 入 新 设备 。OpenMIPS 通 过 总 线 接口 挂 在 总 线 上 ， 
各 种 外 部 设备 的 控制 器 也 挂 在 总 线 上 ， 如 图 12-4 所 示 。 因 为 OpenMIPS 
采用 的 是 哈佛 结构 ， 所 以 有 两 个 总 线 接口 ， 分 别 是 指令 总 线 接口 和 数 
据 总 线 接口 。 图 12-4 中 的 Flash 控 制 器 、SDRAM 控 制 器 、SRAM 控 制 
器 、UARI 控 制 器 都 具有 同样 的 总 线 接口 ， 都 可 以 挂 在 总 线 上 ， 并 且 


都 可 以 放置 在 FPGA 内 部 。 如 果 要 添加 其 他 设备 控制 器 ， 那 么 只 要 具 
有 相同 的 总 线 接口 ， 就 可 以 直接 挂 在 总 线 上 ， 不 需要 修改 OpenMIPS。 


FPGA 


OpenMIPS 


指令 总 线 接口 数据 总 线 接口 


| | 
| | | | 


Flash 控 制 器 SDRAM 控 制 器 SRAM 控 制 器 UART 控 制 器 | eee 


Flash SDRAM SRAM 串口 | oo 


图 12-4 改进 的 连接 外 部 设备 的 方法 一 一 通过 总 线 


各 种 控制 器 可 以 直接 使 用 已 有 的 人 P 核 ， 目 前 有 很 多 IP 核 的 研发 者 
或 公司 ， 为 了 方便 不 同 研发 者 或 公司 的 IP 核 能 够 互相 连接 ， 就 要 求 这 
些 IP 核 遵守 相同 的 总 线 规范 。 总 线 规范 定义 了 IP 核 之 间 的 通用 接口 。 
单 见 的 片上 总 绪 规范 有 ARM 公 司 的 AMBA、 了 JIBM 公 司 的 CoreConnect、 
Altera 公 司 的 Avalon， 以 及 Wishbone， 本 书 的 实践 版 0penMIPS 采 用 的 
就 是 Wishbone 总 线 规范 。Wishbone 总 线 规范 是 Silicore 公 司 最 先 提出 
的 ， 由 于 其 开放 性 ， 现 在 已 有 不 少 用 户 群 ， 特 别 是 一 些 开源 的 IP 核 ， 
大 多 数 都 采用 Wishbone 规 范 。 


综合 上 述 分 析 ， 实 践 版 OpenMIPS 处 理 器 的 设计 目标 就 是 在 教学 版 
OpenMIPS 处 理 器 的 基础 上 添加 Wishbone 总 线 接口 ， 这 样 就 能 方便 地 将 
其 挂 接 在 Wishbone 总 线 上 ， 从 而 可 以 使 用 大 量 开源 的 SDRAM、 


Flash、GPIO、UART、LCD 等 模块 的 控制 器 ， 组 成 一 个 SOPC， 完 成 
特定 功能 ， 成 为 一 个 能 发 挥 实际 作用 的 处 理 器 。 


12.2 Wishbone 总 线 介 绍 


12.2.1 Wishbone 总 线 接口 说 明 


Wishbone 除 了 开放 、 免 费 ， 还 有 简单 、 灵 活 、 轻 量 、 支 持 用 户 自 
定义 标签 等 特点 。 目 前 已 发 布 B4 版 本 的 规范 ，OpenMIPS 处 理 器 遵循 
的 是 Wishbone B2 版 本 的 规范 。 


Wishbone 有 多 种 连接 方式 : BWR. Wan HERA. RNA 
联 等 。 在 点 对 点 连接 方式 中 ， 有 一 个 主 设备 ， 一 个 从 设备 ， 连 接 关系 
如 图 12-5 所 示 ， 注 意图 中 输出 信号 的 名 称 使 用 “_O” 结 束 ， 输 入 信号 的 
名 称 使 用 “_I”* 结 束 。 此 外 ， 所 有 的 信号 都 是 高 电 平 有 效 。 


SYSCON 


CLK I (e > CLK I 
RSTI e > RSTI 
ADR_O > ADR I 
DATI e _ yp DATI 
主 DAT_O AA DAT_O M 
设 WE_O » WEI 设 
备 SEL_O > SELI 从 
STB_O > STB_I 
ACK_I | ACK_O 
CYC_O > CYCI 
TAGN_O meer > TAGN I 
用 户 自 定义 
TAGN I 4 -一 一 TAGN O 


图 12-5 Wishbone 总线 规范 点 对 点 连接 方式 
图 12-5 中 ， 主 、 从 设备 的 接口 含义 如 下 。 


(1) CLK_I, RSTI: 分 别 是 时 钟 信 号 、 复 位 信号 ， 由 外 部 输 
Re 


(2) DAT_O/DAT_I: 数据 总 线 ， 数 据 可 以 由 主 设备 传送 给 从 设 
备 ， 也 可 以 由 从 设备 传送 给 主 设备 。 一 对 主 设备 和 从 设备 之 间 最 多 存 
在 两 条 数据 总 线 ， 一 条 用 于 主 设备 向 从 设备 传输 数据 ， 另 一 条 用 于 从 
设备 向 主 设备 传输 数据 。 


(3) ADR_O/ADR I: 地 址 总 线 ， 地 址 由 主 设备 传送 给 从 设备 。 


(4) WE_O/WE_I: 写 使 能 信号 ， 由 主 设备 传送 给 从 设备 ， 代 表 
当前 进行 的 是 写 操 作 还 是 读 操作 ，1 代 表 写 操作 ，0 代 表 读 操作 。 


(5) SEL_O/SEL_I: 数据 总 线 选 择 信号 ， 用 于 标识 当前 操作 中 ， 
数据 总 线 上 哪些 比特 是 有 效 的 ， 以 总 线 粒 度 为 单位 。SEL_O/SEL [的 
宽度 为 数据 总 线 宽度 除 以 数据 总 线 粒 度 。 比 如 一 个 具有 32 位 宽 、 粒 度 
为 1 个 字 节 的 数据 总 线 的 选择 信号 应 定义 为 SEL_O(3:0)/ SEL_I(3:0)， 此 
时 ，SEL_O(4’b1001) 就 代表 当前 操作 中 数据 总 线 的 最 高 和 最 低 字 节 有 
o 


(6) CYC_O/CYC_I: 总 线 周 期 信号 ，CYC_O/CYC_I 有 效 代表 一 
个 主 设备 请 求 总 线 使 用 权 或 者 正在 占有 总 线 ， 但 是 不 一 定 正在 进行 总 
线 操作 (是 否 正在 进行 总 线 操作 取决 于 选 通信 号 STB_O/STB_I 是 否 
效 ) 。 只 有 在 CYC_O/CYC _I 信 号 有 效 的 情况 下 ，Wishbone 主 设备 和 从 
设备 之 间 的 其 他 信号 才 有 意义 。CYC_O/CYC _I 信 号 在 一 次 总 线 操作 过 
程 中 必须 持续 有 效 ， 比 如 : 一 次 块 读 操作 可 能 需要 多 个 时 钟 周 期 ， 那 
么 CYC_O/CYC I 信 号 必须 在 这 多 个 时 钟 周期 持续 有 效 。 


(7) STB_O/STB_I: 选 通信 号 。 选 通信 号 有 效 代 表 主 设备 发 起 一 
次 总 线 操作 。 只 有 选 通信 号 有 效 时 (此 时 CYC_O/CYC I 也 必须 有 
效 ) ，ADR O/ADR I、DAT O/DAT I, SEL O/SEL I 才 有 意义 。 


(8) ACK_O/ACK 1: 实际 还 可 以 有 ERR_O/ERRI A 
RTY_O/RTY_I， 都 是 主 从 设备 间 的 操作 结束 信号 。ACK 表示 成 功 ， 
ERR 表示 错误 ，RTY 表示 重 试 。 操 作 总 是 在 某 一 总 线 周期 内 完成 的 ， 
因此 操作 结束 也 称 为 总 线 周期 结束 。 成 功 是 操作 的 正常 结束 方式 ， 错 
误 表 示 操 作 失 败 ， 造 成 失败 的 原因 可 能 是 地 址 或 者 数据 校 验 错误 ， 写 
操作 或 者 读 操 作 不 支持 等 。 重 试 表示 从 设备 当前 忙 ， 不 能 及 时 处 理 该 


操作 ， 可 以 稍 后 重新 发 起 。 接 收 到 操作 失败 或 者 重 试 后 ， 主 设备 如 何 
响应 取决 于 主 设备 的 设计 者 。 


(9) TAGN_O/TAGN_I: 标签 信号 ， 用 户 可 以 利用 标签 信号 传递 
自 定 义 的 信息 。 


一 个 总 线 周期 由 多 个 时 钟 周 期 构成 ， 用 来 完成 一 次 操作 ， 可 以 是 
单 次 读 / 写 操作 、 块 读 / 写 操作 、 读 改写 操作 ， 总 线 周 期 也 相应 分 为 单 
次 读 / 写 周期 、 块 读 / 写 周 期 、 读 改写 周期 。 本 蔬 重 点 介绍 单 次 读 / 写 周 
期 。 


一 般 情 况 下 ， 一 次 操作 由 主 设备 和 从 设备 之 间 的 一 次 握手 ， 以 及 
同时 进行 的 地 址 和 数据 总 线 的 一 次 传输 构成 。 当 主 设 备 将 CYC_O 置 
高 ， 一 个 总 线 周 期 开始 ， 此 后 当 STB_O 为 高 时 ， 一 次 总 线 操作 开始 。 
CYC_O 和 STB_O 可 以 同时 从 低 电 平 变 为 高 电 平 ， 表 示 开 始 总 线 周 期 的 
同时 发 起 一 次 总 线 操作 。 


以 下 分 别 介 绍 Wishbone 总 线 单 次 读 操 作 、 单 次 写 操作 的 过 程 。 


12.2.2 ”Wishbone 总 线 单 次 读 操作 的 
过 程 


主 从 设备 之 间 的 信号 虽然 很 多 ， 但 单 次 读 / 瑟 操作 实际 上 十 分 简 
单 。 单 次 读 操 作 的 Wishbone 总 线 信号 如 图 12-6 所 示 ， 此 处 是 从 主 设备 
的 角度 观察 信号 变化 情况 。 
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图 12-6 ”Wishbone 总 线 单 次 读 操作 时 主 设备 的 信号 (不 考虑 TAGN_O/TAGN _D) 


在 时 钟 上 升 治 0， 主 设备 将 地 址 信号 ADR_O、 适 当 的 SEL_O 放 到 


次 总 线 操作 开始 。 


在 时 钟 上 升 沿 1 到 达 之 前 ， 从 设备 检测 到 主 设备 发 起 的 操作 ， 将 适 
当 的 数据 放 到 主 设备 的 输入 接口 DAT_I， 同 时 将 主 设备 的 输入 ACK_I 
置 高 ， 作 为 对 主 设备 STB_O 的 响应 。 从 设备 可 以 在 设置 ACK_I 有 效 之 
前 ， 插 入 任意 数量 的 等 待 状态 。 


在 时 钟 上 升 沿 1， 主 设备 发 现 ACK_I 信 号 为 高 ， 于 是 采样 DAT_I 信 
号 ， 作 为 读 取 到 的 数据 ， 并 将 CYC_O 和 STB_O 置 低 ， 表 示 操 作 完 成 。 
从 设备 检测 到 STB_O 置 低 后 ， 将 主 设备 的 输入 ACK_I 也 置 低 。 单 次 读 
操作 就 完成 了 。 


12.2.3 “Wishbone 总 线 单 次 写 操 作 的 
过 程 


单 次 写 操 作 的 Wishbone 总 线 信号 如 图 12-7 所 示 ， 此 处 还 是 从 主 设 
备 的 角度 观察 信号 变化 情况 。 
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El12-7 ”Wishbone 总 线 单 次 写 操作 时 主 设备 的 信号 (不 考虑 TAGN_O/TAGN _D) 


在 时 钟 上 升 沿 0， 主 设备 将 地 址 信号 ADR_O、 数 据 信 号 DAT_O 放 
到 总 线 上 ， 将 WE_O 置 高 ， 表 示 写 操作 。 将 适当 的 SEL_O 放 到 总 线 
oe A O 中 哪些 字 节 是 有 效 的 。 将 CYC_O、STB_O 置 
高 ， 表 示 一 次 总 线 操作 开始 。 


在 时 钟 上 升 沿 1 到 达 之 前 ， 从 设备 检测 到 主 设备 发 起 的 操作 ， 于 是 
锁 存 DAT_O 的 数据 ， 同 时 将 主 设备 的 输入 ACK_I 置 高 ， 作 为 对 主 设备 
STB_O 的 响应 。 从 设备 可 以 在 设置 ACK_I 有 效 之 前 ， 插 入 任意 数量 的 


在 时 钟 上 升 沿 1， 主 设备 发 现 ACK _I 信 号 为 高 ， 于 是 将 STB_O 和 
CYC_O 置 低 ， 表 示 操 作 完 成 。 从 设备 检测 到 STB_O 置 低 后 ， 将 主 设备 
的 输入 信号 ACK_I 也 置 低 。 单 次 写 操作 就 完成 了 。 


以 上 两 小 节 介 绍 了 Wishbone 总 线 规 沁 的 单 次 读 / 写 操作 的 操作 周 
期 ， 本 书 不 打算 介绍 Wishbone 总 线 规范 的 块 读 / 写 、 读 改写 操作 对 应 的 
操作 周期 ， 因 为 实践 版 OpenMIPS 处 理 器 只 使 用 到 了 单 次 读 / 瑟 操作 。 


12.2.4 SEL _O/SEL I 信和 号 说 明 


了 解 了 Wishbone 总 线 规范 ， 现 在 可 以 解答 我 们 在 第 9 章 “ 加 载 存 储 
指令 的 实现 ”中 遇 到 的 一 个 问题 ， 在 9.3.3 节 解释 lb 指令 的 访 存 过 程 时 ， 
提出 如 下 间 题 。 


“为 何不 直接 设置 mem_sel o 为 4b0001， 表 示 希 望 数 据 存储 器 给 
出 的 数据 的 第 0-7bit 就 是 要 读 取 的 字 节 ， 而 不 考虑 mem_addr_i 的 最 后 
两 位 为 何 值 ， 这 样 不 是 更 简单 吗 ? > 


当时 的 解释 如 下 。 


“的 确 ， 这 样 做 是 更 简单 了 ， 但 是 这 里 确定 mem_sel_o 值 的 过 程 实 
际 上 参考 了 Wishbone 总 线 的 相关 规范 ， 为 了 是 在 后 期 给 OpenMIPS 添 
加 wishbone 总 线 接口 的 时 候 容 易 一 些 。” 


在 Wishbone 总 线 规范 中 ， 对 主 设备 的 输出 SEL_O (也 就 是 从 设备 
的 输入 SEL_I) 是 有 具体 规定 的 ， 不 同 的 总 线 宽 度 、 不 同 的 大 小 端 模 
式 ， 这 个 规定 是 不 同 的 。 因 为 OpenMIPS 的 地 址 、 数 据 总 线 宽度 是 
32bit， 并 且 是 大 端 模 式 ， 所 以 此 处 只 介绍 当地 址 、 数 据 总 线 宽度 是 
32bit， 且 为 大 端 模式 时 的 规定 。 


读 操 作 时 ， 主 设备 通过 ADR_O 送 出 32 位 的 地 址 ， 从 设备 将 
ADR_O 最 低 两 位 置 为 0， 作 为 目标 地 址 ， 给 出 对 应 的 32 位 数据 ， 输 入 
到 主 设备 的 接口 DAT_I。Wishbone 总 线 规范 明确 了 主 设备 的 DAT_J 与 
SEL_O 的 对 应 关系 ， 如 图 12-8 所 示 。 


31 24 23 16 15 87 0 

DAT I {ADR_O[31:2], 2b00} 地 址 | {ADR_O[31:2], 2b01} 地 址 | {ADR_O[31:2], 2b10} 地 址 | {ADR_O[31:2], 2'b11} 地 址 
一 对 应 的 字 节 对 应 的 字 节 对 应 的 字 节 对 应 的 字 节 
SEL_O SEL_O[3] SEL_O[2] SEL_O[1] SEL_O[0] 


图 12-8” 读 操作 时 ，DAT I 与 SEL_O 的 对 应 关系 


所 以 ， 假 设 ib 指 令 的 加 载 目 标 地 址 的 最 低 两 位 是 10， 那 么 就 要 求 
设置 mem sel 0 为 4b0010。 


写 操 作 时 ， 主 设备 通过 ADR 0O 送 出 32 位 的 地 址 ， 从 设备 将 
ADR_O 最 低 两 位 置 为 0， 作 为 目标 地 址 。Wishbone 总 线 规范 明确 了 主 
设备 的 DAT_0O 与 SEL_O 的 对 应 关系 如 图 12-9 所 示 。 


31 24 23 16 15 57 0 
DATO 本 字 节 写 入 地 址 本 字 节 写 入 地 址 本 字 节 写 入 地 址 本 字 节 写 入 地 址 
一 | {ADR_O[31:2], 2'b00}4b | (ADR_O[31:2], 2'b0134%k | {ADR_o[312].2b10} 处 | (ADR_O[31:2], 2'b11} 4b 
SEL_O SEL O[3] SEL O[2] SEL O[1] SEL O[0] 


图 12-9 写 操作 时 ，DAT_0 与 SEL_O 的 对 应 关系 


所 以 ， 假 设 sb 指 令 的 存储 目标 地 址 的 最 低 两 位 是 10， 那 么 就 要 求 
设置 mem sel 0 为 4b0010。 


现在 ， 读 者 可 以 回 到 9.3.3 节 ， 体 会 加 载 存储 指令 的 访 存 过 程 ， 盛 
其 是 其 中 对 信号 mem_sel_o 的 赋值 ， 应 该 可 以 理解 了 。 


12.3 实践 版 OpenMIPS 处 理 器 接 
LJ 


实践 版 OpenMIPS 处 理 器 仍然 采用 哈佛 结构 ， 即 分 开 的 指令 、 数 据 
接口 。 其 接口 如 图 12-10 所 示 。 还 是 采用 左边 是 输入 接口 ， 右 边 是 输出 
接口 的 方式 绘制 ， 这 样 比较 直观 ， 便 于 理解 。 


OpenMIPS (ZR) 


iwishbone_addr_o ~ 


— iwishbone_data_i iwishbone_data_o }—— 
——| iwishbone_ack_i iwishbone_we_o |—— 
iwishbone_sel_o —— 
iwishbone_stb_o —— 
iwishbone_cyc_o 上 一 
dwishbone_addr_o ~ 
—— | dwishbone_data_i dwishbone_data_o 上 一 
—— dwishbone_ack_i dwishbone_we_o }—— 
dwishbone_sel_o |} —— 


— inti dwishbone_stb_o }—— 
— rst dwishbone_cyc_o — 
— clk timer_int_o —— 


图 12-10 实践 版 OpenMIPS 处 理 器 的 外 部 接口 图 


读者 可 以 对 比 图 3-4 教 学 版 OpenMIPS 处 理 器 的 外 部 接口 图 ， 从 中 
可 以 发 现 图 12-10 只 是 将 图 3-4 中 的 指令 存储 器 、 数 据 存储 器 的 接口 分 


别 换 成 指令 Wishbone 总 线 接口 、 数 据 Wishbone 总 线 接口 ， 其 余 未 变 。 
各 个 接口 的 描述 如 表 12-1 所 示 。 


表 12-1 ”实践 版 OpenMIPS 处 理 器 外 部 接口 描述 


续 表 
输入 输出 


FT K Wishbone R28" EIE 


iwishbone_sel_o 输 ! 1% Wishbone 总 线 字 节 选择 信号 


iwishbone_stb_o 输 ! 1% Wishbone 总 线 选 通信 


, 
= 
iwishbone_cyc_o 输 ! 15 


32 输入 He Wishbone 总 线 输 入 的 数据 

ck i TEE ET HS Wishbone 总 线 输入 的 啊 应 

数据 Wishbone 总 线 输 出 的 地 址 

数据 Wishbone 总 线 输出 的 数据 


iwishbone data 1 


iwishbone ack 1 


dwishbone addr o 


1 
1 
1 
l 


2 

3 is 

4 is a 

; 
16 
7 | dwishbone swo [1 | 输出 数据 Wishbone 总 线 选 通信 和 号 
fis |dwishbonecyeo [1 | 给! 数据 Wishbone 总 线 周期 信号 


18 
19 dwishbone data i | 32 MA 数据 Wishbone 总 线 输入 的 数据 
20 dwishbone_ack i 1 输入 数据 Wishbone 总 线 输 入 的 啊 应 


数据 Wishbone 总 线 写 使 能 信号 
数据 Wishbone 总 线 字 节 选择 信号 


12.4 实践 版 OpenMIPS 处 理 器 的 


实现 思路 很 直观 : 将 教学 版 OopenMIPS 对 指令 存储 器 、 数 据 存储 器 
的 访问 信号 分 别 经 过 Wishbone 总 线 接口 模块 ， 转 化 为 标准 的 Wishbone 
总 线 接口 信号 ， 即 可 。 如 图 12-11 所 示 。 


实践 版 OpenMIPS 


教学 版 OpenMIPS 


站 令 接口 数据 接口 


Wishbone ™ 2k Wishbone ™ Zé 
接口 模块 接口 模块 


指令 Wishbone 总 线 接口 数据 Wishbone 总 线 接口 


图 12-11 ”实践 版 OpenMIPS 处 理 器 的 实现 思路 


为 了 实现 实践 版 OpenMIPS， 需 要 对 教学 版 OpenMIPS 的 系统 结构 
进行 修改 ， 主 要 修改 如 图 12-12 所 示 。 


CTRL 
实践 版 OpenMIPS l 
stallreq from if 
stallreq from mem 
ctrl.y 
Ha | YY 
取 指 | 访 存 
PC IF/ID | p MEM 
pe if pc | mem_data_i 
ce g if inst Wishbone 总 线 接口 
pe_reg.v W Ishbone BART | mem_addr_o >| cpu_addr_i cpu_data_o 
cpu_addr_i cpu_data_o | mem ce o | cpu ce i 
> cpu ce i if_id.v | mem data 0 | cpu data i 
32'h00000000—>* cpu_data_i | mem we_o HB cpu we i stallreq 
1'b0—» cpu we i stallreq mem sel o [>| cpu sel i 
4'b1111—>| cpu sel i | clk wishbone_addr_o 
clk wishbone_addr_o | men. rst wishbone_data_o 
rst wishbone_data_o | stall i wishbone_we_o 
stall i wishbone_we_o | flush i wishbone sel o 
flush i wishbone_sel_o r—>?| wishbone data ii wishbone_stb_o 
>| wishbone data i  wishbone_stb_o | >| wishbone ack i  wishbone cyc_o 
m >| wishbone ack i wishbone _cyc_o ] | = = 
指令 Wishbone 总 线 接口 数据 Wishbone 总 线 接口 


图 12-12 在 教学 版 OpenMIPS 的 基础 上 进行 修改 ， 以 实现 实践 版 OpenMIPS 


对 图 12-12 有 如 下 几 点 说 明 。 
(1) 主要 修改 了 流水 线 的 取 指 、 访 存 阶段 。 


(2) 在 取 指 阶段 添加 了 Wishbone 总 线 接口 模块 ， 使 得 PC 模块 给 
出 的 指令 存储 器 访问 信号 不 再 直接 连接 外 部 指令 存储 器 ， 而 是 经 过 
Wishbone 总 线 接口 模块 转化 为 Wishbone 总 线 接口 信号 。 


(3) 由 于 指令 存储 器 是 只 读 的 ， 并 且 指 令 宽度 固定 为 32 位 ， 所 以 
取 指 阶段 添加 的 Wishbone 总 线 接口 模块 的 输入 cpu_data i 直接 设置 为 
32'h00000000; cpu we i 固定 为 0， 表示 始终 是 读 操作 ; cpu_sel if 
定 为 4b1111。 


(4) 添加 Wishbone 总 线 接口 后 ， 指 令 会 存储 在 FPGA 心 片 外 部 的 
Flash 中 ， 导 致 取 指 时 间 多 于 1 个 时 钟 周期 。 在 指令 没有 取 到 时 ， 需 要 
暂停 流水 线 ， 所 以 在 取 指 阶段 添加 的 Wishbone 接 口 模块 有 一 个 输出 接 
口 stalllreq， 连 接 到 CTRL 模 块 新 增加 的 输入 接口 stallreq_from_ if， 该 信 
号 表示 取 指 阶段 是 否 请 求 流水 线 暂停 。 


(5) 在 访 存 阶段 也 添加 了 Wishbone 总 线 接口 模块 ， 使 得 MEM 模 
块 对 数据 存储 器 的 访问 信号 不 再 直接 连接 外 部 数据 存储 器 ， 而 是 经 过 
Wishbone 总 线 接口 模块 转化 为 Wishbone 总 线 接口 信号 。 


(6) 添加 Wishbone 总 线 接口 后 ， 数 据 会 存储 在 FPGA 心 片 外 部 的 
SDRAM 中 ， 导 致 访问 数据 的 时 间 多 于 1 个 时 钟 周 期 。 在 数据 没有 访问 
到 时 ， 需 要 暂停 流水 线 ， 所 以 在 访 存 阶段 添加 的 Wishbone 接 口 模块 也 
有 一 个 输出 接口 stalllreq ， 连 接 到 CTRL 模 块 新 增加 的 输入 接口 
stallreq_from_mem, 该 信号 表示 访 存 阶段 是 否 请 求 流水 线 暂停 。 


12.5 ”从 教学 版 OpenMIPS 到 实践 
FROpenMIPS 


12.5.1 Wishbone 总 线 接口 模块 的 实 
现 


Wishbone 总 线 接口 模块 的 作用 是 将 处 理 器 对 外 部 设备 的 访问 请 求 
转化 为 Wishbone 总 线 信 和 号， 在 图 12-12 中 已 经 给 出 了 其 接口 示意 图 ， 具 
体 描 述 如 表 12-2 所 示 。 


表 12-2 ”Wishbone 总 线 接口 模块 的 接口 描述 


宽度 (bit) | 输入 /输出 


rst 输入 复位 信号 


序 号 

1 l 
mA CTRL 模块 传 入 的 流水 线 暂 停 信号 
mA CTRL 模块 传 入 的 流水 线 清除 信号 
输入 米 自 处 理 器 的 访问 请 求 信号 
32 输入 来 自 处 理 器 的 数据 
输入 米 自 处 理 器 的 地 址 信 员 
输入 米 自 处 理 器 的 写 操作 指示 信号 

10 32 { 

11 


flush i 


cpu data i 


cpu_data_o 输出 到 处 理 器 的 数据 


wishbone addr o 32 Amt Wishbone 总 线 输出 的 地 址 


wishbone_data_o Wishbone 总 线 输出 的 数据 


wishbone we o 输 Wishbone 总 线 写 使 能 信和 号 


Wishbone 总 线 选 通信 和 号 


i 
3 sft 1 
wishbone stb o 1 
ate 1 ” 
ack 1 
1 


Wishbone sel o 4 y Wishbone 总 线 字 节 选择 信号 


3 
wishbone data i 3 输入 Wishbone 总 线 输入 的 数据 


本 节 将 采用 有 限 状 态 机 实现 Wishbone 总 线 接口 模块 ， 首 先 定义 三 

个 状态 : EMMA (WB_IDLE) 、 总 线 忙 状态 (WB_BUSY) 、 等 待 

暂停 结束 状态 (WB_WAIT_FOR_STALL) 。 这 三 个 状态 对 应 的 宏 定 
义 在 defines.v 文 件 中 定义 ， 如 下 。 


‘define WB_IDLE 2'b00 SARS 
“define WB _BUSY 2'bo1 // 总 线 忙 状 态 
“define WB_WAIT_FOR STALL 2'b11 // 等 待 暂停 结束 状态 


个 状态 之 间 的 转化 关系 如 图 12-13 所 示 。 


处 理 器 发 起 了 访问 请 求 ， 且 当前 
不 是 处 于 流水 线 清 除 过 程 中 


复位 - a 
— > WB_IDLE 


WB_BUSY 


两 种 情况 之 一 : (1) 收 到 了 Wishbone 总 线 
的 响应 ， 且 流水 线 没 有 处 于 暂停 状态 ， 
(2) 发 生 了 异常 ， 处 理 器 给 出 了 流水 线 清 


\ 
\ 除 信号 I 
\ / El] Y Wi 总 
流水 线 结束 暂 信 \ 收 到 了 Wishbone 总 
WLI EX Ei NA TS pa / UAM Y, Hizk 
EN S 线 处 于 暂停 状态 
EN BA 
WB_WAIT_FOR_STALL de 


图 12-13 ”Wishbone 总 线 接口 模块 的 状态 机 
(1) 复位 的 时 候 进 入 空闲 状态 WB_IDLE。 


(2) 当 处 于 空闲 状态 WB_IDLE 时 ， 如 果 处 理 器 发 出 了 访问 请 
求 ， 且 当前 没有 处 于 流水 线 清除 过 程 中 ， 那 么 会 进入 总 线 忙 状态 
WB_BUSY， 开 始 访问 总 线 。 但 是 ， 如 果 人 处 于 流水 线 清 除 过 程 中 ， 那 
么 本 次 的 总 线 访问 当然 会 无 效 ， 所 以 不 必 有 进入 WB_BUSY 状 态 。 


(3) 当 处 于 总 线 忙 状态 WB_BUSY 时 ， 如 果 收 到 Wishbone 总 线 的 
响应 ， 表 示 本 次 访问 结束 ， 此 时 需要 判断 流水 线 是 否 处 于 暂停 状态 。 


。 如 果 没 有 处 于 暂停 状态 ， 那 么 将 访问 到 的 数据 送 入 处 理 器 ， 
进入 空闲 状态 WB_IDLE， 等 待 下 一 次 访问 请 求 。 

。 如 果 处 于 暂停 状态 ， 那 么 将 访问 到 的 数据 暂时 保存 起 来 ， 同 
时 进入 等 待 暂停 结束 状态 WB_WAIT_FOR_STALL。 当 流 水 
线 暂停 结束 时 ， 再 将 访问 到 的 数据 送 入 处 理 器 ， 并 且 进 入 空 
闲 状 态 WB_IDLE， 等 待 下 一 次 访问 请 求 。 


(4) 当 处 于 总 线 忙 状态 WB_BUSY 时 ， 如 果 发 生 了 异常 ， 那 么 会 
清除 流水 线 ， 此 时 将 直接 取消 此 次 Wishbone 总 线 访问 ， 并 且 回 到 状态 
WB_IDLEo 


Wishbone 总 线 接口 模块 的 代码 如 下 ， 源 文件 是 位 于 本 书 附带 光盘 
Code\Chapter12 目 录 下 的 wishbone_bus_if.v 文 件 中 。 


module wishbone_bus_if( 


input wire clk, 

input wire rst, 

// 来 自 ctr1 模 块 

input wire[5:0] stall_i, 
input wire tlush_ 1, 


//CPU 侧 的 接口 


input wire cpu_ce_i, 


stallreq <= "NoStop; 
cpu_data_o <= rd_buf; 
end 
default: begin 
end 
endcase 
end 


end 


endmodule 


上 述 代 码 可 以 分 为 两 部 分 : 一 部 分 是 控制 状态 转化 的 时 序 电 路 ， 
另 一 部 分 是 给 处 理 器 接口 信号 赋值 的 组 合 电路 。 分 别 解释 如 下 。 


(1) 控制 状态 转化 的 时 序 电路 


复位 的 时 候 进入 WB_IDLE 状 态 ， 同 时 将 Wishbone 总 线 的 选 通 
信号 wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 设置 为 
0， 表 示 无 效 。 

。 在 WB_IDLE 状 态 下 ， 如 果 处 理 器 要 访问 总 线 (cpu_ce_i 为 
1) ， 且 没有 处 于 流水 线 清除 过 程 中 (flush i 为 False_v) , AB 
么 会 进入 WB_BUSY 状 态 ， 同 时 Wishbone 总 线 的 选 通信 号 
wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 设置 为 1， 
表示 开始 Wishbone 总 线 访 问 周 期 。 要 访问 的 地 址 
wishbone_addr_o 就 是 输入 信号 cpu_addr i 的 值 ， 访 问 类 型 
wishbone_we_o 就 是 输入 信号 cpu_we i 的 值 ， 字 节选 择 信号 
wishbone_sel_o 就 是 输入 信号 cpu_sel i 的 值 。 如 果 是 写 操 作 ， 


那么 要 写 的 数据 wishbone_data_o 就 是 输入 信号 cpu_data i 的 

值 。 

在 WB_BUSY 状态 下 ， 如 果 收 到 Wishbone 总 线 的 响应 
(wishbone_ack i 为 1) ， 那 么 设置 Wishbone 总 线 的 选 通信 号 

wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 为 0， 从 而 

结束 Wishbone 总 线 访问 周期 。 如 果 是 读 操作 (cpu_we i 为 

WriteDisable) ， 那 么 还 会 将 读 到 的 数据 保存 到 变量 rd_buf 

中 。 接 下 来 有 两 种 可 能 : 如 果 流 水 线 没有 和 暂停 (stall_ i 等 于 

6'b000000) ， 那 么 进入 空 闪 状态 WB_IDLE。 如 果 流 水 线 暂 

停 (stall ji 不 等 于 6b000000) ， 那 么 进入 等 待 暂停 结束 状态 

WB WAIT FOR STALL.。 

。 人 在 WB_BUSY 状 态 下 ， 如 果 在 还 没有 收 到 Wishbone 总 线 的 响 
MA, 发生 了 异常 ， 导 致 处 理 器 要 清除 流水 线 (flush i 为 
Truev) ， 那 么 设置 Wishbone 总 线 的 选 通 信号 
wishbone_stb o、 周 期 选择 信号 wishbone_cyc_o 都 为 0， 从 而 
结束 总 线 访问 周期 。 同 时 ， 回 到 空 闪 状态 WB_IDLE。 

。 在 等 待 暂 停 结 束 状态 WB_WAIT_FOR_STALL 下 ， 当 流水 线 
暂停 结束 时 (stall i 等 于 6%b000000) ， 进 入 空间 状态 
WB_IDLEo 


(2) 给 处 理 器 接口 信号 赋值 的 组 合 电路 


。 在 WB_IDLE 状 态 下 ， 如 果 处 理 器 要 访问 总 线 (cpu_ce i 为 
1) ， 且 没有 处 于 流水 线 清除 过 程 中 (flush_i 为 False_v) ， 那 
么 需要 暂停 流水 线 以 等 待 此 次 Wishbone 总 线 访问 结束 ， 所 以 
设置 输出 信号 stallreq 为 Stop。 


TE WB_BUSY 状态 如 果 收 到 Wishbone 总线 的 响应 
ee) , ， 那 么 表示 此 次 访问 结束 ， 流水 线 可 
以 继续 ， 所 以 设置 输出 信号 stallreq 为 NoStop。 如 果 是 读 操 作 
( cpu wei X WriteDisable ) ， 那 么 将 读 到 的 数据 
wishbone_data_i 通 过 cpu_data_o 接 口 送 给 处 理 器 。 
在 WB_BUSY 状 态 下 ， 如 果 没 有 收 到 Wishbone 总 线 的 响应 
(wishbone_ack_ i 不 为 1)y ， 那 么 表示 此 次 访问 还 没有 结束 ， 
流水 线 要 保持 暂停 ， 所 以 设置 输出 信号 stallreq 为 Stop。 
在 等 待 暂停 结束 状态 wWB_WAIT_FOR_STALL 下 ， 此 时 的 
Wishbone 总 线 访 问 已 经 结束 ， 所 以 设置 输出 信号 stallreq 为 
NoStop， Fen RA EF Wishbone SARUTE] SF Ia o 
同时 ， 将 缓存 到 变量 rd_buf 的 数据 通过 cpu_data_o 接 口 送 给 处 
理 器 。 


12.5.2 ”修改 CTRL 模 块 


从 图 12-12 可 知 ， 实 际 例 化 了 两 个 Wishbone 总 线 接口 模块 ， 分 别 位 


于 流水 线 的 取 指 阶段 、 访 存 阶 段 。 这 是 由 于 OpenMIPS 处 理 器 设计 采用 
哈佛 结构 ， 即 分 开 的 指令 、 数 据 总 线 。 两 个 模块 各 有 一 个 流水 线 暂停 
请 求 信号 stallreq， 都 输出 到 CTRL 模 块 ， 分 别 表示 取 指 阶段 请 求 流水 线 
暂停 、 访 存 阶段 请 求 流水 线 暂 停 ， 所 以 要 修改 CTRL 模 块 ， 添 加 部 分 
接口 ， 如 表 12-3 所 示 。 


表 12-3 CTRL 模块 增加 的 接口 


修改 CTRL 模 块 的 代码 如 下 ， 修 改 的 部 分 使 用 加 粗 、 斜 体 标 识 。 
完整 代码 请 参考 本 书 附 带 光 盘 中 Code\Chapter12 目 录 下 的 ctrl.v 文 件 。 


endmodule 
读者 回顾 一 下 第 7 章 实现 暂停 机 制 时 的 说 明 ， 主 要 有 两 点 。 


(1) OpenMIPS 采 用 的 是 一 种 改进 的 流水 线 暂停 机 制 : 假如 流水 
线 第 n 阶 段 请 求 流水 线 暂停 ， 那 么 需 使 取 指 令 地 址 PC 的 值 不 变 ， 同 时 
保持 流水 线 第 n 阶 段 、 第 n 阶 段 之 前 各 个 阶段 的 寄存 器 的 值 不 变 ， 而 第 n 
阶段 后 面 的 指令 继续 运行 。 比 如 : 流水 线 执行 阶段 请 求 流 水 线 暂 停 ， 
那么 保持 PC 不 变 ， 保 持 取 指 、 译 码 、 执 行 阶段 的 寄存 器 不 变 ， 但 是 允 
许 访 存 、 回 写 阶段 的 指令 继续 运行 。 


(2) CTRL 模 块 的 输出 信号 stall 是 一 个 宽度 为 6 的 信号 ， 其 含义 如 
下 ， 分 别 输出 到 流水 线 各 个 阶段 。 


stall[0] 表 示 取 指 地 址 PC 保持 不 变 。 
stall[1] 表 示 流 水 线 取 指 阶段 暂停 。 
stall[2] 表 示 流 水 线 译 码 阶段 暂停 。 
stall[3] 表 示 流 水 线 执行 阶段 暂停 。 
stall[4] 表 示 流 水 线 访 存 阶段 暂停 。 
stall[5] 表 示 流 水 线 回 写 阶 段 暂停 。 


理解 了 上 面 的 两 点 就 比较 容易 理解 我 们 对 CTRL 模 块 的 修改 了 ， 
还 是 分 取 指 、 访 存 两 种 情况 解释 。 


(1) 如 果 是 访 存 阶段 请 求 暂停 ， 那 么 除 回 写 阶 段 外 ， 其 余 各 阶段 
都 要 暂停 ， 所 以 设置 stall 为 6b011111。 


(2) 如 果 是 取 指 阶段 请 求 暂停 ， 那 么 理论 上 应 该 只 暂停 取 指 阶 
段 、 保 持 PC 不 变 ， 也 就 是 设置 stall 为 6b000011， 但 是 上 面 CTRL 模 块 
的 代码 将 stall 设 置 为 6b000111， 使 得 流水 线 译 码 阶 段 也 暂停 ， 这 么 
做 ， 主 要 是 考虑 到 一 种 特殊 情况 : 假设 译 码 阶段 的 指令 是 转移 指令 ， 
那么 此 时 取 指 阶段 将 要 取 到 的 指令 就 是 延迟 槽 指令， 将 译 码 阶段 也 暂 
停 ， 保 持 了 转移 指令 与 延迟 槽 指令 在 流水 线 中 的 相对 位 置 ， 从 而 能 够 
正确 识别 出 延迟 槽 指令 ， 如 图 12-14 所 示 。 如 果 取 指 阶段 暂停 ， 而 不 使 
译 码 阶段 暂停 ， 那 么 转移 指令 会 在 下 一 周期 进入 执行 阶段 ， 同 时 在 译 
码 阶 段 会 填充 空 指 令 ， 这 样 就 使 得 填充 的 空 指令 被 误 认 为 是 延迟 槽 指 
令 ， 从 而 出 错 ， 如 图 12-15 所 示 。 


取 指 译 码 执行 访 存 回 写 
时 刻 T dk >< 转移 指令 >< 
时 刻 T+1 < 取 指 暂停 >< 转移 指令 > le: Al >< | 
时 刻 Ttm < 指令 取 到 > 转移 指令 > 
时 刻 Ttm < IIE 转移 指令 > Á 

= = <= 


1 取 到 的 指令 就 是 是 延迟 槽 指令 


图 12-14 ” 取 指 、 译 码 阶段 同时 暂停 ， 从 而 正确 识别 延迟 模 指 令 


取 指 译 码 执行 访 存 回 写 
时 刻 T A 转移 指令 OAC 
WAITH KO 取 指 暂停 NOP > 转移 指令 之 


1 插入 的 空 指令 被 认为 是 延迟 档 指 令 


图 12-15 ” 取 指 阶段 暂停 ， 译 码 阶段 没有 暂停 ， 会 错误 识别 延迟 槽 指令 


12.5.3 ”修改 OpenMIPS 顶 层 模 块 


因为 添加 了 Wishbone 总 线 接口 模块 ， 所 以 需要 修改 OpenMIPS 顶 层 
模块 ， 在 其 中 例 化 Wishbone 总 线 接口 模块 ， 并 按照 图 12-12 所 示 将 其 和 
其 他 模块 连接 起 来 ， 具 体 代 码 不 在 书 中 罗列 ， 读 者 可 以 参考 本 书 附 审 
光盘 Code\Chapter12 目 录 下 的 openmips.v 文 件 。 


12.6 ”实践 版 OpenMIPS 处 理 器 实 
现 小 结 


本 章 在 教学 版 OpenMIPS 处 理 器 的 基础 上 ， 通 过 添加 Wishbone 总 线 
接口 模块 ， 实 现 了 实践 版 OpenMIPS 处 理 器 ， 这 样 我 们 的 OpenMIPS 处 
理 器 就 可 以 方便 地 使 用 现在 已 有 的 大 量 开源 IP 核 ， 包 括 SDRAM 控 制 
器 、Flash 控 制 器 、UART 控 制 器 等 ， 从 而 可 以 快速 搭建 一 个 实用 的 
SOPC。 


在 第 13 章 ， 就 将 基于 实践 版 OpenMIPS 处理 器 构建 一 个 小 型 
SOPC ， 该 SOPC 可 以 下 载 实际 的 FPGA 开 发 板 上 ， 用 来 检验 实践 版 
OpenMIPS 处 理 器 是 否 实现 正确 。 


第 13 章 ”基于 实践 版 OpenMIPS 的 
小 型 SOPC 


第 12 章 通过 为 教学 版 OopenMIPS 处 理 器 添加 Wishbone 总 线 接口 实现 
了 实践 版 OpenMIPS 处 理 器 ， 但 是 没有 经 过 验证 ， 本 章 将 基于 实践 版 
OpenMIPS 搭 建 一 个 小 型 SOPC， 下 一 章 将 以 其 为 平台 ， 运 行 验证 程 
序 ， 以 检验 实践 版 OpenMIPS 处 理 器 是 否 实现 正确 。 


本 章 搭建 的 小 型 SOPC 包 括 GPIO 模 块 、UART 控 制 器 、Flash 控 制 
器 、SDRAM 控 制 器 等 ， 这 些 控制 器 与 OpenMIPS 处 理 器 都 连接 到 
Wishbone 总 线 互 联 和 矩阵 上 ， 本 章 13.3 至 13.6 节 将 分 别 介绍 这 些 控制 器 


13.1 小 型 SOPC 的 结构 


实践 版 OpenMIPS 处 理 器 与 其 余 各 种 控制 器 都 是 通过 Wishbone 总 线 
连接 在 一 起 的 ，Wishbone 总 线 有 四 种 互联 方式 : 点 对 点 、 数 据 流 、 共 
享 总 线 、 交 叉 互 联 。 在 点 对 点 方式 中 ， 一 般 只 有 一 个 主 设备 、 一 个 从 
设备 ， 但 是 对 于 一 个 片上 系统 而 言 ， 一 般 存 在 多 个 模块 ， 并 且 某 一 模 
块 能 够 访问 其 余 多 个 模块 ， 比 如 存在 CPU、DMA 控 制 器 、Flash 控 制 
器 、SDRAM 控 制 器 、GPIO 等 ， 其 中 CPU、DMA 控 制 器 作为 主 设备 ， 
Flash 控 制 器 、SDRAM 控 制 器 、GPIO 作 为 从 设备 ， 主 设备 CPU 可 以 访 
问 所 有 的 从 设备 ， 主 设备 DMA 控 制 器 也 可 以 访问 所 有 的 从 设备 ， 当 两 
者 对 同一 设备 发 出 访问 请 求 时 ， 就 需要 一 个 仲裁 机 制 来 判断 哪个 主 设 
备 占用 总 线 ， 所 以 ， 片 上 系统 一 般 使 用 共享 总 线 或 者 交叉 互联 方式 。 
分 别 介绍 如 下 。 


1. HERS 


共享 总 线 方式 适合 于 系统 中 有 两 个 或 者 多 个 主 设备 需要 与 一 个 或 
者 多 个 从 设备 通信 的 情况 ， 它 们 通过 共享 的 总 线 进行 通信 。 主 设备 在 
需要 与 一 个 从 设备 通信 有 时， 需要 先 向 仲裁 器 申请 总 线 占 有 权 ， 获 得 允 
许 后 开始 占用 总 线 并 与 目标 从 设备 开始 通信 ， 通 信 结 束 后 释放 总 线 。 
当 多 个 主 设备 同时 希望 占有 总 线 时 ， 仲 裁 器 通过 一 定 的 优先 级 逻辑 分 
配 总 线 使 用 机 会 。 其 典型 框图 如 图 13-1 所 示 。 共 享 总 线 的 缺点 是 同一 
时 刻 只 能 有 一 对 主 、 从 设备 建立 通信 。 


2。 交 叉 互 联 


交叉 互联 主要 使 用 在 多 个 主 设备 同时 访问 多 个 从 设备 的 情况 ， 其 
典型 框图 如 图 13-2 所 示 。 人 在 这 种 连接 方式 下 ， 主 设备 发 出 对 某 个 从 设 
备 的 访问 请 求 ， 仲 裁 器 查看 总 线 和 从 设备 是 否 空 几 ， 从 而 决定 是 否 给 
主 设备 总 线 访问 权 。 交 叉 互 联 方式 允许 多 对 主 设备 和 从 设备 同时 进行 
通信 ， 而 共享 总 绪 方 式 在 同一 时 刻 只 允许 一 对 主 、 从 设备 进行 通信 。 


. rt Ly 
Wishbone Wh 2k 


仲裁 器 
从 设备 A 从 设备 B 从 设备 C 
图 13-1 共享 总 线 方式 
主 设备 A 主 设 备 B 
Wishbone 总 线 
( O ticas 


从 设备 A 从 设备 B 从 设备 C 


图 13-2 ”交叉 互联 方式 


本 章 建立 的 小 型 SOPC 使 用 的 就 是 交叉 互联 方式 ， 其 结构 如 图 13-3 
所 示 。 在 Wishbone 总 线 上 挂 接 了 五 个 模块 : 实践 版 OpenMIPS 处 理 器 、 
GPIO、UART 控 制 器 、PFlash 控 制 器 、SDRAM 控 制 器 。 其 中 Wishbone 
总 线 使 用 的 是 OpenCores 站 点 提供 的 开源 项 目 WB_CONMAX， 这 是 一 
个 Wishbone 总 线 互 联 和 矩阵 ， 采 用 的 是 交叉 互联 方式 ， 人 允许 多 对 主 从 设 
备 同 时 进行 通信 。 


实践 版 


OpenMIPS 
Wishbone 总 线 

WB_CONMAX N 

SDRAM 控 制 器 | | UART 控 制 器 | | GPIO | | Flash 控 制 器 

SDRAM 芯 片 ”9 针 串 行 接口 “LED、 开 关 、 Flash 芯片 


数码 管 等 


图 13-3 ”小 型 SOPC 的 结构 


13.2 “Wishbone 总 线 互 联 和 矩阵 
WB_CONMAX 


读 者 可 以 使 用 SVN 从 
http://opencores.org/ocsvn/wb_conmax/wb_conmax 下载 得 到 最 新 的 
WB_CONMAX 的 代码 ， 下 载 前 需要 首先 在 OpenCores 站 点 注册 ， 下 载 
的 时 候 输 入 在 OpenCores 站 点 注册 时 的 用 户 名 和 密码 。 也 可 以 在 本 书 光 
盘 Code\Chapter13\wb_conmax 目 录 下 找到 所 有 代码 。WB_CONMAX 模 
块 有 如 下 特点 。 


© 支持 8 个 Wishbone 总 线 主 设备 。 

。 支持 16 个 Wishbone 总 线 从 设备 。 

。 内 置 仲裁 器 ， 支 持 1、2 或 4 个 优先 级 。 
。 人 允许 多 对 主 从 设备 同时 相互 通信 。 

。 支持 WishboneB2 版 本 。 


WB_CONMAX 模 块 的 结构 如 图 13-4 所 示 。 主 设备 选择 从 设备 进行 
通信 时 ， 依 据 主 设备 提供 的 Wishbone 地 址 的 高 4 位 确定 是 选择 哪 一 个 从 
设备 进行 通信 ， 当 地 址 高 4 位 为 0 时 ， 选 择 的 就 是 从 设备 0， 当 地 址 高 4 
位 为 15 时 ， 选 择 的 就 是 从 设备 15。 所 以 每 个 从 设备 的 寻 址 空间 大 小 都 
是 256M， 其 中 从 设备 0 的 寻 址 空间 是 0x00000000-0x0OFFFFFFF。 本章 
建立 的 小 型 SOPC 中 各 个 模块 与 WB_CONMAX 的 连接 如 图 13-5 所 示 。 


od 从 设备 接口 0 | 一 一 一 
设备 接 D0 EL) 
\ JA Mika 一 一 一 
SS e — 
主 设备 接 DI EY K/ 实践 版 
\ A fo Se = OpenMIPS 
\ XS A ARERI | | 数据 总 线 指令 总 线 
a KA Y Wishbone 2% 
// A O ONG :设备 EBA 
Y) Ww À HO 201 WB_CONMAX 
a N \ 从 设备 从 设备 从 设备 从 设备 | | 
N \ #00 接口 1 接口 2 接 D3 \/ 
N 从 设备 接口 15 一 一 一 | | | | 
SDRAM 控 制 器 | | UART 控 制 器 GPIO Flash 控 制 器 
图 13-4 WB_CONMAX 模 块 的 结构 图 13-5 小 型 SOPC 中 各 个 模块 与 


WB_CONMAX 的 连接 关系 图 


OpenMIPS 具 有 分 开 的 指令 、 数 据 接 口 ， 所 以 占用 WB_CONMAX 
两 个 主 设 备 接口 ， 其 中 数据 接口 连接 到 主 设备 接口 0， 指 令 接 口 连接 到 
主 设 备 接 口 1。 


SDRAM 控 制 器 连接 到 从 设备 接口 0、UART 控 制 器 连接 到 从 设备 
接口 1、GPIO 连 接 到 从 设备 接口 2>、Flash 控 制 器 连接 到 从 设备 接口 3。 
所 以 上 述 各 个 外 设 的 寻 址 空间 如 表 13-1 所 示 。 


表 13-1 ”小 型 SOPC 中 各 个 外 设 的 寻 址 空间 


| gee 寻 址 空间 


EE 


一 个 实用 的 片上 系统 通常 将 程序 放置 在 Flash 中 ， 系 统 启动 后 从 
Flash 读 取 第 一 条 指令 ， 从 表 13-1 可 知 ，Flash 对 应 的 是 从 地 址 
0x30000000 开 始 的 256M 字 节 空 间 ， 所 以 需要 修改 实践 版 OpenMIPS 处 
理 器 ， 使 得 其 在 复位 结束 后 从 地 址 0x30000000 处 开始 取 指 。 只 需要 修 
改 取 指 阶段 的 PC 模块 即 可 实现 此 目的 ， 主 要 修改 如 下 ， 完 整 代码 请 读 
者 参考 本 书 附带 光盘 Code\Chapterl3\OpenMIPS 目 录 下 的 pc_reg.v 文 
件 。 


module pc_reg( 


); 


always @ (posedge clk) begin 
if (ce == “ChipDisable) begin 
pc <= 32'h30000000; // RRP RISHA 
0x30000000 


end else begin 


endmodule 


13.3 GPIO 


GPIO (General Purpose Input Output) 是 以 位 为 单位 进行 数字 输入 
输出 的 VO 接口 ， 作 为 单纯 的 通用 输入 /输出 VO， 输入 时 从 外 部 读 取 输 
入 信号 ， 输 出 时 将 写 入 的 值 输出 到 外 部 。 处 理 器 通过 GPIO 可 以 与 各 种 
设备 相连 接 ， 例如: LED, AX, CRAMBES 


本 章 建立 的 小 型 SOPC 将 直接 使 用 OpenCores 站 点 提供 的 开源 项 目 
GPIO IP Core， 读 者 可 以 在 OpenCores 站 点 下 载 源 代码 ， 也 可 以 直接 在 
本 书 附 带 光 盘 Code\Chapterl3\gpio 目 录 下 找到 所 有 源 代 码 。 在 本 书 附 
带 光 盘 中 Doc 目 录 下 提供 了 该 GPIO 的 说 明 手册 。 其 具有 如 下 特点 。 


IO 接口 数量 从 1 到 32 可 配置 。 

所 有 的 IO 接口 都 可 以 配置 为 双向 接口 。 

输入 接口 可 以 触发 中 断 。 

具有 复 用 输入 接口 ，GPIO 最 终 的 输出 信号 可 以 是 Wishbone 总 
线 接口 的 输入 信号 ， 也 可 以 是 复 用 输入 接口 的 信号 。 

可 以 采用 Wishbone 总 线 的 时 钟 ， 也 可 以 采用 单独 的 时 钟 。 
支持 Wishbone B 版 本 (手册 中 未 明确 说 明 是 哪个 版 本 ， 从 接 
口 情况 分 析 ， 可 能 是 B2 版 本 ) o 


接口 描述 如 表 13-2 所 示 。 


X13-2 GPIO IP 核 的 外 部 接口 描述 


TE 


wb _clk i 输入 Wishbone 总 线 时 钟 信和 号 


wb rst i 输入 Wishbone 总 线 复 位 信和 号 


wb dat 1 


Wishbone 总 线 周期 信号 
Wishbone 总 线 输入 的 地 址 
Wishbone 总 线 输入 的 数据 


wb we i Wishbone 总 线 写 使 能 信和 号 


wb sel i a Wishbone 总 线 字 节选 择 信和 号 


wb stb i Wishbone 总 线 选 通信 和 号 


wb dat o Wishbone 总 线 输出 的 数据 


wb ack o Wishbone 总 线 输 出 的 响应 
Wishbone 总 线 输出 的 错误 响应 
中 断 信号 
复 用 输入 信号 
PA u NEE 
jee E 输出 信号 
输出 使 能 信号 
外 部 时 钟 输入 


D Ne D 6 


GPIO IP 核 的 功能 是 通过 配置 一 系列 寄存 器 实现 的 ， 主 要 的 寄存 器 
如 表 13-3 所 示 。 


7213-3 GPIO IP 核 中 的 主要 寄存 器 


MEE Te ala E mm 


RGPIO OUT 可 读 可 写 GPIO 输出 的 信和 号 
RGPIO_OE 可 读 可 写 GPIO 输出 接口 使 能 信号 
RGPIO_INTE 可 读 可 写 中 断 使 能 信和 号 


其 中 地 址 一 栏 中 的 Base 就 是 GPIO 的 基地 址 ， 从 图 13-5 可 知 ， 小 型 
SOPC 中 的 GPIO 挂 接 在 从 设备 接口 2， 因 此 GPIO 对 应 的 地 址 空间 是 
0x20000000-0x2FFFFFFF， 所 以 表 13-3 中 的 Base 就 等 于 0x20000000， 这 
样 就 可 以 知道 各 个 寄存 器 的 确切 地 址 了 ， 例 如 : RGPIO_OUT 宵 存 器 
的 地 址 就 是 0x20000004。 对 其 中 的 RGPIO_OE、RGPIO_INTE 两 个 寄 
存 器 解释 如 下 。 


(1) RGPIO_OE 


宽度 为 1~32 可 选 ， 当 某 一 位 为 1 时 ， 相 应 的 输出 接口 使 能 ， 当 某 
一 位 为 0 时 ， 相 应 的 输出 接口 为 三 态 或 open-drain 模 式 。 复 位 的 时 候 ， 
所 有 位 都 为 0。 


(2) RGPIO_INTE 


宽度 为 1~32 可 选 ， 当 某 一 位 为 1 时 ， 相 应 的 输入 接口 能 产生 中 
断 ， 当 某 一 位 为 0 时 ， 相 应 的 输入 接口 不 能 产生 中 断 。 复 位 的 时 候 ， 所 
有 位 都 为 0。 


GPIO IP %% E gpio_defines.v, gpio_top.v 两 个 文件 组 成 。 其 中 
gpio_defines.v 文 件 有 一 些 宏 定义 需要 配置 ， 目 的 是 使 得 输入 、 输 出 接 
口 的 宽度 都 是 32， 如 下 。 


//I0 接 口 的 数量 ， 可 以 配置 的 范围 是 1-32， 默 认 是 31， 此 处 改 为 32 
“define GPIO_IOS 32 


// 与 10 接 口 数量 要 对 应 ， 默 认 是 31， 此 处 也 改 为 32 
‘define GPIO LINES 32 


// 将 下 面 的 宏 定义 注释 掉 ， 表 示 没有 复 用 输入 接口 ， 也 就 是 没有 表 13-2 中 的 aux_i 接 
a 
//~ define GPIO_AUX_IMPLEMENT 


// 在 小 型 S0OPC 中 ，GPIO 模 块 的 时 钟 采用 的 是 Wishbone 总 线 的 时 钟 ， 所 以 将 下 面 的 宏 
定义 注释 掉 ， 


// 表 示 没 有 外 部 时 钟 输入 接口 ， 也 就 是 没有 表 13 -2 中 的 cLk_pad_:i 接 口 
// define GPIO_CLKPAD 


13.4 UART $Z 


13.4.1 UART 和 简介 


UART 即 通用 异步 收发 器 ( Universal Asynchronous 
Receiver/Transmitter) ， 是 广泛 使 用 的 串 行 数据 传输 协议 。 它 的 功能 是 
将 并 行 的 数据 转变 为 串 行 的 数据 发 送 或 者 将 接收 到 的 串 行 数 据 转 变 为 
并 行 数 据 。 当 本 章 设计 的 小 型 SOPC 具 备 了 UART 控 制 器 之 后 ， 就 可 以 
通过 串口 与 计算 机 进行 通信 了 。 


UART 产 生 于 20 世 纪 70 年 代 ，Intel 8250 是 第 一 代 产 品 ， 被 使 用 在 
IBM-PC 及 其 兼容 机 上 ， 用 于 与 Modem 或 串 行 打印 机 进行 通信 ， 随 着 
PC 的 成 功 和 迅速 普及 ， 确 定 了 UART 的 结构 和 特性 ， 经 过 8250A、 
16450、16C451、16550， 逐 步 发 展 到 16550A。16550A 与 用 于 8250 的 
软件 兼容 ， 但 是 提供 了 更 高 的 性 能 ， 其 性 能 增强 的 关键 是 使 用 了 先进 
先 出 堆栈 (FIFO) 作为 缓存 ， 配 置 了 16 字 节 的 发 送 FIFO 和 16 字 节 的 接 
收 FIFO。 之 后 虽然 也 有 新 的 UART 出 现 ， 但 是 从 内 部 结构 分 析 ， 实 际 
都 是 在 16550 的 基础 上 增加 了 寄存 器 ， 从 软件 角度 分 析 ， 变 化 并 不 大 。 
因此 ，16550 是 实际 上 的 工业 标准 UART， 分 为 A、B、C、D 共 4 种 型 


To 


下 面 分 别 介绍 UART 数 据 传输 、 数 据 接收 、 流 控制 的 基本 过 程 。 


(1) UART 的 数据 传输 


UART 在 传输 的 时 候 ， 将 待 传输 数据 的 每 个 字符 一 位 一 位 地 传 
输 。 传 输 格式 如 图 13-6 所 示 。 


< 数据 位 > 


| NY XZ / yf NY A. ff N. \ | VE | 
We aaa. X X X Xx >< XMSBX “eae Pa | 


He 收发 状态 > 所 一 空闲 


图 13-6 UARI 的 数据 传输 格式 


依次 传输 起 始 位 、 数 据 位 、 奇 偶 校 验 位 、 停 止 位 ， 分 别 说 明 如 
下 。 


起 始 位 : 先 发 出 一 个 低 电 平 信号 ， 也 就 是 逻辑 “0”， 表 示 传 输 的 
开始 。 


数据 位 : 紧 接 着 起 始 位 之 后 的 是 数据 位 。 数 据 位 的 个 数 可 以 是 
4、5、6、7、8 等 ， 构 成 一 个 字符 ， 从 字符 的 最 低位 开始 传送 。 


奇偶 校 验 位 : 数据 位 之 后 是 奇偶 校 验 位 。 数 据 位 加 上 这 一 位 后 ， 
使 得 “1” 的 个 数 为 偶数 ( 偶 校 验 ) 或 奇数 〈 奇 校 验 ) ， 以 此 来 判断 数据 
传送 的 正确 与 否 。 


停止 位 : 是 一 个 字符 数据 的 结束 标志 ， 可 以 是 1 位 、1.5 位 、2 位 的 
高 电 平 信号 。 


UART 的 通信 速率 用 波 特 率 (baud rate) 来 表示 。 波 特 率 指 的 是 信 
号 被 调制 以 后 的 变化 率 ， 即 单位 时 间 内 载波 变化 的 次 数 。 用 于 波 特 率 
计算 的 信号 除了 数据 位 ， 还 包括 起 始 位 、 奇 偶 校 验 位 、 停 止 位 ， 


此 ， 波 特 率 与 单纯 的 数据 传输 速率 是 不 同 的 。UART 常 用 的 波 特 率 有 
9600 baud、19200 baud、38400 baud 等 。 


(2) UART 的 数据 接收 


UART 的 数据 接收 部 分 采用 比 波 特 率 高 的 采样 频率 实现 。 实 际 使 
用 中 ， 一般 使 用 比 波 特 率 高 16 倍 的 接收 时 钟 进行 采样 。 为 了 便于 说 
明 ， 图 13-7 以 接收 时 钟 是 波 特 率 的 4 倍 为 例 ， 给 出 了 数据 接收 过 程 。 


接收 信号 \ | Eb / LSB pr | = a A M$B Donan > Put 
NN 


@ ©) © (@) (a) ©) 
图 13-7 UART 的 数据 接收 过 程 


(a) 当 接 收 信号 由 高 电 平 变 为 低 电 平时 ， 表 示 检 测 到 起 始 位 。 


(b) 检测 到 起 始 位 后 ， 在 接 下 来 的 第 2 个 时 钟 周期 检查 接收 信 
号 ， 如 果 保 持 为 低 电 平 ， 说 明确 实 是 起 始 位 ， 开 始 接收 数据 。 否 则 认 
为 起 始 位 检测 错误 ， 将 其 忽略 。 


(c) 确定 是 起 始 位 后 ， 等 待 4 个 时 钟 周 期 检查 接收 信号 ， 得 到 的 
值 就 是 接收 到 的 第 一 个 bit， 也 就 是 LSB。 


(d) 之 后 每 隔 4 个 时 钟 周 期 检查 接收 信号 ， 依 次 得 到 传送 过 来 的 
数据 位 、 奇 偶 校 验 位 。 从 图 中 可 以 发 现 ， 每 次 采样 都 是 在 接收 数据 的 
中 部 ， 这 样 采 样 得 到 的 数据 更 加 准确 。 


(e) 数据 接收 完成 后 ， 接 收 停止 位 。 
(3) 流 控制 


数据 在 两 个 UART 之 间 传 输 时 ， 瘦 常会 出 现 丢 失 数 据 的 现象 ， 比 
如 : 两 全 PC 的 处 理 速 度 不 同 ， 如 果 接 收 方 数 据 缓 冲 区 已 满 ， 那 么 此 时 
继续 发 送 来 的 数据 束 会 丢失 ， 特 别 是 使 用 PC 机 与 Modem 进 行 数据 传输 
时 ， 这 个 问题 尤为 突出 ， 流 控制 就 是 用 于 解决 这 个 问题 的 。 当 接收 方 
数据 处 理 不 过 来 时 ， 就 发 出 “不 再 接收 ”的 信号 ， 发 送 方 则 停止 发 送 ， 
直到 收 到 “可 以 继续 发 送 ” 的 信号 再 发 送 数 据 ， 因 此 流 控制 可 以 控制 数 
据 传 输 进程 ， 防 止 数 据 丢 失 。UART 常 用 的 两 种 流 控制 是 硬件 流 控制 
和 软件 流 控制 |。 


对 硬件 流 控制 进行 简单 介绍 。 引 入 了 两 对 握手 信号 RTS/CTS、 
DTR/DSR。 第 一 对 握手 信号 是 RTS 和 CTS， 当 接收 方 准 备 好 接收 数据 
时 ， 将 RTS 置 高 ， 表 示 它 准备 好 了 ， 如 果 发 送 方 也 就 绪 ， 那 么 置 高 
CTS ， 表 示 它 即将 发 送 数据 。 第 二 对 握手 信号 是 DTR 和 DSR， 主 要 用 
于 Modem 通 信 。 例 如 : 当 Modem 已 经 准备 好 接收 来 自 PC 的 数据 时 ， 就 
置 高 DTR， 表 示 和 电话 线 的 连接 已 经 建立 。 如 果 DSR 线 置 高 ， 那 么 PC 
将 开始 发 送 数 据 。 一 个 简单 的 规则 是 DTR/DSR 用 于 表示 系统 通信 就 
绪 ， 而 RTS/CTS 用 于 单个 数据 包 的 传输 。 


13.4.2 UART16550 IP 核 介绍 


本 章 建 立 的 小 型 SOPC 采 用 的 UART 控 制 器 是 OpenCores 站 点 提供 
的 开源 项 目 UART16550 IP Core， 读 者 可 以 在 OpenCores 站 点 下 载 产 代 
人 码 ， 也 可 以 直接 在 本 书 附带 光盘 Code\Chapter13\uart 目 录 下 找到 所 有 源 
代码 。 该 IP 核 具有 如 下 特点 。 


。 最 大 程度 的 兼容 国家 半导体 公司 (National Semiconductor) 
的 16550A 设 备 。 


支持 Wishbone B 版 本 。 
。 Wishbone 接 口 侧 的 数据 总 线 宽度 可 以 设置 为 32 或 者 8。 


其 接口 可 以 分 为 三 部 分 ， 分 别 如 表 13-4、 表 13-5、 表 13-6 所 示 。 
3213-4 UART16550 IP 核 的 wishbone 接 口 信号 


输入 /输出 
输入 


W 
Wi 
w i 输入 ishbone 总 线 周 期 信和 号 
Ww 
Wi 


wb addr i 3 或 者 5 Wishbone 总 线 输入 的 地 址 
b dat i ak 32 Wishbone 总 线 输入 的 数据 


序 号 
1 
2 
3 
4 
5 
6 


b we i fil Wishbone 总 线 写 使 能 信和 号 


8 或 32 a Wishbone 总 线 输出 的 =" 


3213-5 UART16550 IP 核 的 中 断 信 号 


| 
| 


表 13-6 UART16550 IP 核 的 串 行 接口 信号 


串口 输入 


3 s E i RTS (Request To Send) 请 求 发 送信 和 号 

4 cts pad i 全 CTS (Clear To Send) 清除 发 送信 和 号 

5 ig i DTR (Data Terminal Ready) 数据 终端 准备 好 信号 
6 输 DSR (Data Set Ready) 数据 准备 好 信和 号 


i RI (Ring Indicator) 振 铃 指 示 信 号 
dod pal. i 输 DCD (Data Carrier Detect) 数据 载波 检测 信和 号 


d 合 山 波 特 率 输出 信号 ， 其 频率 是 实际 波 特 率 的 16 
bau E AY 中 TR eb die 
倍 ， 该 信号 是 可 选 的 


同 GPIO 一 样 ，UART16550 IP 核 的 功能 也 是 通过 配置 一 系列 寄存 
器 实现 的 ， 如 表 13-7 所 示 。 


表 13-7 UART16550 IP 核 中 的 寄存 器 


寡 存 器 名 称 地 HE E E 访问 方式 作用 描述 
Receiver Buffer Base + 0x0 8 只 读 接收 缓冲 
Transmitting Holding Register (THR) Base + 0x0 8 AS 发 送 保持 


Interrupt Enable Register | Base+0x1 fs | 可 读 可 写 中 断 控制 


Interrupt Identification Base + 0x2 只 读 中 断 标志 
FIFO Control Base + 0x2 AS FIFO 控制 


un [aa 

a CAPI Modem 控制 

ae a | 

其 中 地 址 一 栏 中 的 Base 就 是 UART 控 制 器 的 基地 址 ， 从 图 13-5 可 

知 ， 小 型 SOPC 中 的 UART 控 制 器 挂 接 在 从 设备 接口 1， 因 此 UART 控 制 
器 对 应 的 地 址 空间 是 0x10000000-0x1FFFFFFF， 所 以 表 13-7 中 的 Base 就 
等 于 0x10000000， 于 是 便 可 以 知道 各 个 寄存 器 的 确切 地 址 。 除 了 表 13- 
7 中 列 出 的 寄存 器 之 外 ， 还 有 两 个 寄存 器 ， 组 成 一 个 16bit 的 分 频 系 
数 ， 用 于 时 钟 分 频 ， 如 表 13-8 所 示 。 


3213-8 UART16550 卫 核 中 的 分 频 系数 寄存 器 


E AA 


Divisor Latch Byte 1 Base + 0x0 
Divisor Latch Byte 2 Base + 0x1 


读者 朋友 可 能 注意 到 ， 此 处 两 个 分 频 系 数 寄 存 器 的 地 址 与 表 13-7 
中 的 寄存 器 有 冲突 ， 解 决 方法 是 ， 当 Line Control Register (LCR) & 
存 器 的 第 7bit 为 1 时 ， 地 址 Base + 0x0、base + 0x1 对 应 的 就 是 两 个 分 频 
系数 寄存 器 ， 反 之 ， 对 应 的 是 表 13-7 中 的 寄存 器 。 


本 书 在 第 14 章 验证 小 型 SOPC 的 时 候 ， 没 有 使 用 UART16550 IP 核 
的 流 控制 等 功能 ， 只 是 使 用 了 简单 的 数据 发 送 、 接 收 功 能 ， 因 此 只 对 
与 数据 发 送 、 接 收 有 关 的 寄存 器 进行 说 明 ， 其 余 寄 存 器 的 说 明 可 以 参 
考 本 书 附带 光盘 Doc 目 录 下 UART16550 IP 核 的 使 用 手册 。 需 要 说 明 的 
寄存 器 是 Interrupt Enable Register (IER) 、Line Control Register 
(LCR) 、Line Status (LS) 、 分 频 系数 寄存 器 。 


(1) IER 


中 断 使 能 寄存 器 用 来 设置 是 否 允 许 中 断 ， 各 位 的 作用 如 表 13-9 所 
Mo 


表 13-9 IER 寄 存 器 


位 | 作用 描述 
0] 数据 接收 中 断 : 0 一 一 禁止 ; 1 一 一 使 能 


Transmitting Holding Register 空 中 断 : 0 一 一 禁止 ; 1 
一 一 使 能 


LCR 寄 存 器 用 来 设置 接收 、 发 送 的 数据 格式 。 各 位 的 作用 如 表 13- 
10 所 示 。 


表 13-10 ”LCR 寄存 器 


数据 位 长 度 : 
00 一 一 5 位 
01 一 一 6 位 
10 一 一 7 位 
11 一 一 8 位 


停止 位 长 度 : 

0 一 一 1 位 停止 位 

1 一 一 2 位 停止 位 〈 当 数据 位 长 度 为 5 时 ， 表 示 1.5 位 停 
止 位 ) 


校 验 位 : 
0 一 一 无 校 验 
1 一 一 有 校 验 


校 验 类 型 : 
0 奇 校 验 
1— ER 


添加 奇偶 校 验 位 : 
0 一 一 禁止 添加 奇偶 校 验 位 
1 一 一 使 能 添加 奇偶 校 验 位 


6 间断 控制 位 : 
0 一 一 不 使 用 间断 
1 一 一 串 行 输出 固定 在 逻辑 0 


分 频 系数 寄存 器 访问 位 : 
0 一 一 访问 正常 寄存 器 


1 一 一 访问 分 频 系数 寄存 器 


LS 寄存 器 用 来 指示 发 送 和 接收 的 状态 ， 各 个 位 的 作用 如 表 13-11 所 
示 。 


表 13-11 LS 寄存 器 


接收 数据 标志 : 
1 一 一 接收 FIFO 不 为 空 
0 一 一 接收 FIFO 为 空 


接收 FIFO 溢 出 标志 : 
1] 一 一 FIFO 满 并 且 接 收 移 位 寄存 器 正在 接收 新 数据 。 


读 LS 寄 存 器 后 ， 会 自动 清除 该 位 
0 一 ”接收 FIFO 没 有 溢出 


校 验 错误 标志 : 

1 一 一 FIFO 顶 部 的 字 节 有 校 验 错误 。 读 LS 宵 存 器 后 ， 
会 自动 清除 该 位 

0 一 一 当前 字 节 没有 校 验 错误 


帧 错误 标志 : 

1] 一 -FIFO 顶 部 字 节 有 帧 错误 。 读 LS 寄存 器 后 ， 会 自 
动 清除 该 位 

0 一 一 当前 字 节 没有 帧 错误 


间断 中 断 标志 : 

1 一 一 当前 字 节 有 间断 错误 。 当 串 行 接收 信号 保持 一 
段 时 间 的 逻辑 0 时 ， 认 为 发 生 间 断 错误 ， 此 时 写 一 个 0 
字 节 到 FIFO。 读 LS 寄存 器 后 ， 会 自动 清除 该 位 

0 一 一 当前 字 节 没有 间断 错误 


发 送 FIFO 空 标志 : 


1 一 一 THR 寄 存 器 为 空 ， 但 是 发 送 移 位 寄存 器 不 为 
空 。 在 这 种 情况 下 ， 会 产生 THR 空 中 断 。 向 发 送 
FIFO 写 入 数据 后 ， 会 自动 清除 该 位 

0 一 一 其 余 情况 


发 送 数 据 空 标志 : 

1 一 一 THR 寄 存 器 和 发 送 移 位 寄存 器 都 为 空 。 向 发 送 
FIFO 写 入 数据 后 ， 会 自动 清除 该 位 

0 一 一 其 余 情况 


1 一 一 FIFO 模 式 时 ， 至 少 有 一 个 检验 错误 、 帧 错误 或 
者 间断 发 生 。 读 LS 寄存 器 后 ， 会 自动 清除 该 位 
0 一 一 其 余 情况 


(4) 分 频 系数 寄存 器 


两 个 分 频 系数 寄存 器 形成 一 个 16bit 的 分 频 系数 ， 其 值 需要 依据 系 
统 时 钟 、 波 特 率 进行 计算 ， 计 算 方法 如 下 。 


分 频 系数 = 系统 时 钟 ，(16 倍 的 波 特 率 ) 


使 用 上 式 的 结果 设置 分 频 系数 至 存 器 ， 而 且 设 置 的 时 候 ， 要 先 写 
高 字 节 ， 也 就 是 将 分 频 系数 的 高 8 位 写 入 寄存 器 Divisor Latch Byte 2, 
再 写 低 字 节 ， 也 就 是 将 分 频 系 数 的 低 8 位 写 入 寄存 器 Divisor Latch Byte 
lo 


读者 现在 可 能 对 上 述 寄存 器 的 作用 还 不 太 理解 ， 在 第 14 章 为 小 型 
SOPC 编 写 测 试 程序 的 时 候 ， 读 者 会 切实 体会 到 这 几 个 寄存 器 的 作用 。 


13.5 ”Flash 控制 器 


13.5.1 Flash 简介 


本 章 设 计 的 小 型 SOPC 将 程序 保存 在 Flash 中 ， 并 且 从 Flash 启 动 ， 
所 以 需要 Flash 控 制 器 ， 用 来 进行 Flash 的 读 操作 。Flash 主 要 有 两 种 : 
NAND flash, NOR flash， 前 者 以 “ 块 ” 为 基本 单位 进行 访问 ， 后 者 以 
“ 字 ” 为 基本 单位 进行 访问 ， 因 此 ， 程 序 可 以 直接 在 NOR Flash 里 运行 ， 
不 必 把 程序 复制 到 RAM 里 才 运 行 。 也 正 是 这 个 原因 ， 一 般 把 系统 启动 
代码 存放 到 NOR Flash 里 ， 实 现 从 Flash 启 动 系统 。 本 章 实现 的 Flash 控 
制 器 实际 就 是 NOR Flash 的 控制 器 ， 下 文中 的 Flash 也 都 是 指 NOR 
Flash， 不 再 明确 指出 。 


NOR Flash 的 接口 一 般 如 表 13-12 所 示 。 


X13-12 NOR Flash 的 接口 


宽度 (bit) 输入 /输出 E A 
依据 Flash 容量 确定 | 输入 要 访问 的 地 址 
8、16 或 32 全 入 /输出 写 入 的 数据 / 读 出 的 数据 
MA 片 选 信号 ， 低 电 平 有 效 
MA 输出 使 能 信号 ， 低 电 平 有 效 
MA 写 使 能 信号 ， 低 电 平 有 效 
MA 复位 信号 ， 低 电 平 有 效 


Flash 的 读 取 速 度 较 低 ， 我 们 设想 的 是 : 小 型 SOPC 将 程序 存储 在 
Flash 中 ， 启 动 后 将 主 应 用 程序 (比如 : 操作 系统 ) 从 Flash 复 制 到 
SDRAM 运 行 ， 以 加 快运 行 速 度 ， 所 以 只 涉及 Flash 的 读 操作 ， 本 章 实 
现 的 Flash 控 制 器 也 只 支持 读 操作 。 


Flash 读 操作 的 时 序 如 图 13-8 所 示 。 在 RESET 无 效 (高 电 平 表示 无 
效 ) 的 前 提 下 ，ADDR 接 口 给 出 读 地 址 ，CE、OE 变 为 有 效 ( 低 电 平 表 
示 有 效 ) ，WE 置 为 无 效 (高 电 平 表示 无 效 ) ， 开 始 读 操作 ， 等 待 Tacc 
时 间 后 ， 数 据 通过 DAT 接 口 输出 。 在 这 个 过 程 中 ， 时 间 Tacc 很 关键 ， 
其 表示 从 给 出 读 地 址 到 数据 输出 的 时 延 ， 不 同型 号 的 Flash 有 不 同 的 


Tacco 


ADDR x 地 址 x 
CE ! \ | / 
OE : x | 2 
WE / | | \ 
DAT | (BR 
RESET / | 


图 13-8 ”Flash 读 操作 的 时 序 


13.5.2 ”Flash 控制 器 的 设计 


从 图 13-8 可 知 ，Flash 的 读 操作 很 简单 ， 设 置 完 成 地 址 信号 、 片 选 
信号 、 输 出 使 能 信号 后 ， 只 需 等 待 一 段 时 间 Tacc， 就 可 以 得 到 要 读 取 
的 数据 。 此 处 的 关键 是 Tacc 的 值 是 多 少 ， 该 值 与 具体 Flash 心 片 有 关 。 


本 章 设计 的 SOPC 将 在 DE2 开 发 平台 上 运行 ，DE2 上 的 Flash 心 片 是 
Spansion 公司 的 S29AL032D70TFI04， 容 量 是 4MB ， 是 一 种 NOR 
Flash。 通 过 查询 心 片 手册 可 知 Tacc 最 大 值 等 于 70ns。DE2 上 的 时 钟 有 
两 种 : 27MHz、50MHz， 本 章 设计 的 小 型 SOPC 计 划 采 用 27MHz 的 时 
钟 ， 一 个 时 钟 周 期 大 约 是 37ns， 所 以 最 多 需要 等 待 3 个 时 钟 周期 就 能 得 
到 要 读 取 地 址 的 数据 。 


此 外 ，S29AL032D70TFI04 忌 片 的 数据 线 宽度 是 8， 当 处 理 器 通过 
Wishbone 总 线 读 取 指 令 时 ， 一 条 指令 为 32 位 ， 所 以 共 需 要 4 次 Flash 读 
操作 。 本 书 附带 光盘 Doc 目 录 下 有 Flash 心 片 $S29AL032D70TFI04 的 手 
册 。 


需要 说 明 一 点 : 虽然 本 节 设 计 的 Flash 控 制 器 针对 的 是 
S29AL032D70TFI04 心 片 ， 但 是 其 他 Flash 心 睛 的 控制 器 都 可 以 在 此 基 
础 上 经 过 修改 得 到 。 


13.5.3 “Flash 控制 器 的 实现 


Flash 控 制 器 的 接口 如 表 13-13 所 示 ， 可 以 分 为 两 部 分 : Wishbone 总 
线 接口 部 分 (序号 1-10) 、Flash 心 片 接 口 部 分 (序号 11-16) o 


表 13-13 “Flash 控制 器 的 接口 


输入 /输出 作 用 
MA Wishbone 总 线 时 钟 信号 


MA Wishbone 总 线 复位 信和 号 


10 |wbacko [1 |4 总 线 输出 的 响应 

| | 
涂 信 号 ， 低 电 平 有 效 

Flash 片 选 信号 ， 低 电 平 有 效 


Flash 写 使 能 信号 ， 低 电 平 有 效 


Flash 控 制 器 的 代码 如 下 所 示 ， 源 文件 位 于 本 书 附带 光盘 中 


Code\Chapter13\flash 目 录 下 的 wb_flash.v 文 件 中 。 


module flash_top( 


); 


// Wishbone 总 线 接口 
wb_clk_i, wb_rst_i, wb_adr_i, wb_dat_o, 
wb_dat_i, wb_sel_i, wb_we_i, wb_stb_i, 


wb_cyc_i, wb_ack_o, 


// Flash AO 
flash_adr_o, flash_dat_i, flash_rst, 


flash_oe, flash_ce, flash_we 


£ 
25 


wb_ack_o <= 1'b0; 


waitstate <= 4'h0; 


endmodule 


上 述 代 码 就 是 在 有 读 取 Flash 的 请 求 时 (具体 而 言 就 是 读 指 令 请 
X) ， 分 四 次 从 Flash 中 读 取 出 四 个 字 节 ， 组 成 一 条 指令 。 每 读 取 一 个 
字 节 需要 3 个 时 钟 周期 。 另 外 ， 因 为 OpenMIPS 是 大 端 模式 ， 所 以 首先 
读 取 到 的 字 节 对 应 的 是 指令 的 MSB。 


13.6 SDRAM 控 制 器 


在 本 章 建 立 的 小 型 SOPC 中 还 具有 SDRAM 控 制 器 ， 用 来 读 / 写 
SDRAM。SDRAM 的 读 / 写 速度 快 于 Flash， 而 且 比 Flash 成 本 低 ， 所 以 
一 般 的 片上 系统 都 具有 较 大 容量 的 SDRAM ， 作 为 程序 的 主 运行 空 
间 。 


小 型 SOPC 中 使 用 的 SDRAM 控 制 器 是 一 个 开源 卫 核 ， 但 是 在 配置 
这 个 卫 核 的 时 候 会 用 到 一 些 SDRAM 的 相关 知识 ， 所 以 本 节 先 对 


=~, 


SDRAM 进 行 简 单 介 绍 ， 熟 悉 SDRAM 的 读者 可 以 直接 跳 至 13.6.2 节 。 


13.6.1 ”SDRAM 简介 


13.6.1.1 SDRAM 结 构 


SDRAM (Synchronous Dynamic Random Access Memory) 是 同步 
动态 随机 访问 存储 器 ， 同 步 是 指 Memory 工 作 需 要 同步 时 钟 ， 内 部 命令 
的 发 送 与 数据 的 传输 都 以 它 为 基准 ; 动态 是 指 存储 阵列 需要 不 断 地 刷 
新 以 保证 数据 不 丢失 ， 随 机 访问 是 措 数 据 不 是 线性 依次 读 写 ， 而 是 可 
以 自由 指定 地 址 进行 读 / 写 。 


SDRAM 的 内 部 有 存储 单元 阵列 ， 给 出 行 地 址 、 列 地 址 ， 就 可 以 
选择 对 应 的 存储 单元 。 如 图 13-9 所 示 。 


íT 
i” 
JF 


列 地 址 
图 13-9 ”SDRAM 内 部 具有 存储 单元 阵列 


这 样 的 存储 单元 阵列 称 为 Bank， 在 一 个 SDRAM 中 往往 有 多 个 
Bank， 寻 址 的 时 候 需 要 给 出 对 应 Bank 的 编号 。SDRAM 的 容量 就 等 于 
“Bank 数 量 * 存 储 单元 宽度 * 地 址 数 "”， 例 如 : 某 型 SDRAM 有 4 个 Bank， 


存储 单元 宽度 是 16bit， 行 地 址 数 是 11， 列 地 址 数 是 8， 那 么 该 SDRAM 
的 容量 就 是 32Mbit。 


在 外 部 接口 上 ， 采 用 了 行 地 址 与 列 地 址 复 用 的 方式 ， 为 此 增加 了 
两 个 接口 : 行 地 址 选 通 RAS、 列 地 址 选 通 CAS。 当 RAS 使 能 时 ， 地 址 
线 上 的 信号 是 行 地 址 ， 当 CAS 使 能 时 ， 地 址 线 上 的 信号 是 列 地 址 。 
SDRAM 的 接口 一 般 如 表 13-14 所 示 。 


3813-14 ”SDRAM 的 接口 


宽度 (bit) 输入 /输出 

与 具体 SDRAM 有 关 | 输入 地 址 总 线 

BA 时 钟 信号 

MA 时 钟 使 能 信号 

输入 行 地 址 选 通 信号 ， 低 电 平 有 效 


3 ， 低 电 平 有 效 

字 节 选择 和 输出 使 能 ， 低 电 平 有 效 
与 具体 SDRAM 有 关 i 数据 总 线 
与 具体 SDRAM 有 关 | 输 Bank 选择 信号 


13.6.1.2” ”SDRAM 的 刷新 

SDRAM 是 通过 栅 极 电容 存储 信息 的 ， 由 于 电容 会 漏电 ， 所 以 需 
要 定期 进行 刷新 ， 以 维持 原 有 信息 ， 刷 新 的 方法 就 是 定时 重复 的 对 
SDRAM 进 行 读 出 和 再 写 入 ， 以 使 电容 中 泄露 的 电荷 得 到 补充 。 


13.6.13 SDRAM 的 命令 


对 SDRAM 的 访问 是 通过 一 系列 命令 实现 的 ， 不 同 的 接口 信号 组 
合 代表 不 同 的 命令 ， 例 如 : 当 上 一 个 时 钟 周 期 CKE 接 口 为 高 电 平 ， 且 
本 周期 CS 接口 也 为 高 电 平 ， 那 么 表示 是 “器 件 不 使 能 ”命令 。SDRAM 
主要 命令 的 真 值 表 如 表 13-15 所 示 。 


X13-15 ”SDRAM 主要 命令 的 真 值 表 


iF y X X X X 


~ 


符 号 | CKE[n-1] | CKE[n] | CS | RAS | CAS | WE | ADDR[10] 
READAP H i H L H 
H 


Pa 


L 


WRITEAP 


预 取 所 有 的 Bank 
设置 模式 寄存 器 


自动 刷新 


开始 自 刷 新 SLFRSH L 
结束 自 刷 新 SLFRSHX | L H 


注 :“H” 代 表 高 电 平 ;“L” 代 表 低 电 平 ;“V” 代 表 有 效 数据 ;“X” 代 表 可 以 是 任何 值 


pap 
SN AS 
i 


I 

L 
L 
L 
L 
L 
L 


H 
H 
H 
H 


ht 


13.6.1.4 ”SDRAM 初始 化 


SDRAM 在 加 电 后 ， 必 须 首 先 按照 预定 的 方式 进行 初始 化 ， 之 后 
才能 正常 的 工作 。 初 始 化 需要 四 个 步骤 ， 如 图 13-10 所 示 。 


FY PON A NOA 
Je ARA PA PAZ NT fe 


8 个 刷新 周期 | 设置 模式 寄存 器 "| 


HR mA na EAN IA IN 
PON PON gee N OW. PN ads fh N 
/ Vo] \ $ \ / wo of \ $ \ 
| Kl \ / \ J tf \ ! \ 


200us 的 输入 


所 有 Bank 


预 充电 


af 


l 
| 


图 13-10 SDRAM 初 始 化 的 四 个 步骤 
第 一 步 : 200us 的 输入 稳定 期 ， 在 这 个 时 间 内 只 有 DSEL 和 NOP 命 
令 有 效 ， 这 个 过 程 实际 就 是 自 检 过 程 。 
第 二 步 : 所 有 Bank 预 充电 ， 也 就 是 PALL 命 令 。 
第 三 步 : 执行 8 个 自动 刷新 周期 ， 也 就 是 CBR 命 令 。 


BOD: 设置 模式 寄存 器 ， 也 就 是 MRS 命 令 。 模 式 寄 存 器 的 作用 
将 在 下 一 小 节 讲 解 。 


13.6.1.5 ”模式 寄存 器 


模式 寄存 器 定义 了 SDRAM 的 运行 模式 ， 包 括 CAS 延 迟 (CAS 
Latency) 、 突 发 类 型 (Burst Type) 、 突 发 长 度 (Burst Length) 、 工 
作 模 式 (Operating Mode) 、 写 入 突 发 模式 等 。 模 式 寡 存 器 的 宽度 是 
13bit， 分 为 多 个 字段 ， 如 图 13-11 所 示 。 读 者 需要 重点 关注 的 是 其 中 三 
个 字段 : RAKE. RRR CASH. 

(1) RAKE 

对 SDRAM 的 读 、 写 操作 都 是 采用 突 发 模式 ， 也 就 是 连续 读 、 写 
若干 个 数据 (数据 的 宽度 是 SDRAM 数 据 接 口 的 宽度 ) 。 模 式 寄 存 器 
的 第 0-2bit 定 义 了 突 发 长 度 ， 设 定 在 一 次 突 发 传输 操作 中 传输 多 少数 
据 ， 可 以 从 1，2，4，8 中 进行 选择 ， 还 有 的 SDRAM 支 持 页 模式 。 


Bit M12-M10 M9 M8-M7 M6-M4 M3 M2-MO 
标志 名 保留 写 入 突 发 模式 CHIR CAS HEIR 突 发 类 型 突 发 长 度 
M2-M0 ” 突 发 长 度 
000 1 
001 2 
— 010 4 
011 8 
111 页 
其 它 保留 
M6-M4 “CAS 延 迟 时 钟 
010 2 M3 突 发 类 型 
—> 0 线性 〈Linear) 
其 它 保留 


图 13-11 ”模式 寄存 器 的 各 个 字段 


(2) 突 发 类 型 


1 交织 (Interleave) 


模式 寄存 器 的 第 3bit 定 义 了 突 发 类 型 ， 可 以 有 线性 (Linear) ~ 32 


织 (Interleave) 两 种 。 不 同 的 突 发 长 度 、 不 同 的 起 始 地 址 、 不 同 的 


发 类 型 ， 会 有 不 同 的 地 址 访问 顺序 ， 如 表 13-16 所 示 。 


表 13-16 ” 突 发 长 度 、 起 始 地 址 、 突 发 类 型 与 地 址 访问 顺序 的 关系 


起 始 地 址 


低位 AO=0 


低位 AO=1 


突 发 中 的 地 址 访问 顺序 


线性 (Linear) 交织 (Interleave) 


低 两 位 Al, A0=00 
最 低 两 位 Al, A0=01 


、A0=10 


~ A0=11 


« Al, A0=000 


0-1-2-3-4-5-6-7 


0-1-2-3-4-5-6-7 


Y, A2, Al, A0=001 


1-2-3-4-5-6-7-0 


1-0-3-2-5-4-7-6 


«~ Al, A0=010 


2-3-4-5-6-7-0-1 


2-3-0-1-6-7-4-5 


Y, A2, Al, A0=011 


3-4-5-6-7-0-1-2 


3-2-1-0-7-6-5-4 


2, Al, A0=100 


~ A0=110 


(3) CAS 延 迟 


4-5-6-7-0-1-2-3 


4-5-6-7-0-1-2-3 


5-6-7-0-1-2-3-4 5-4-7-6-1-0-3-2 
6-7-0-1-2-3-4-5 6-7-4-5-2-3-0-1 
7-0-1-2-3-4-5-6 7-6-5-4-3-2-1-0 


VY 


大 


UA as HN E-bit ECASIEIR. CASHEIRFEBJEMREADER 
令 发 出 到 第 一 次 数据 输出 之 间 的 时 间 ， 单 位 是 时 钟 周期 。 通 常设 定 为 
2、3 个 时 钟 周 期 。 也 就 是 说 ， 如 果 READ 命 令 在 第 n 个 时 钟 上 升 沿 被 触 
发 ， 那 么 数据 将 会 在 第 n+CAS 个 时 钟 上 升 治 开始 输出 。 图 13-12 是 CAS 
为 2 的 情况 ， 图 13-13 是 CAS 为 3 的 情况 。 


CLK fi 
ot CLK 
COMMAND (READY WIN NOP WN \ a WN mm om: 
READ MW NOP UN NOP NY i COMMAND READ / WX NOP WN NOP VW Nop UM 
| Ny, | IT, j at cs 
DQ | WM_ Post )W — DQ QU] Pout AU 
CASI E < CAS 延 迟 > 
` Ni ` T 
图 13-12 CAS 为 2 的 情况 图 13-13 CAS 为 3 的 情况 


13.6.1.6 ”Bank 行 激活 


SDRAM 中 有 多 个 Bank， 在 进行 任何 读 、 写 操作 之 前 ， 要 先 选择 
进行 操作 的 Bank， 然 后 激活 这 个 Bank 中 相应 的 行 ， 通 过 执行 命令 ACT 
来 完成 这 个 工作 。 执 行 ACT 命令 时 ， 输 入 接口 BA 选择 Bank， 输 入 接口 
A0-Ax 选 择 相应 的 行 。 当 ACT 命令 执行 完毕 之 后 ， 需 要 进行 操作 的 
Bank 中 的 对 应 行 就 会 被 打开 ， 这 时 就 可 以 进行 读 、 写 操作 了 ， 称 为 激 
活 。 被 激活 的 行 会 保持 激活 状态 ， 直 到 下 一 次 对 所 在 的 Bank 执 行 PRE 


ACT 命令 执行 完毕 之 后 ， 还 不 可 以 立即 进行 读 、 写 操作 ， 需 要 等 


待 一 段 时 间 ， 这 段 时 间 称 为 RAS to CAS Delay, tnidAtRCD, —ARIE 
况 下 ，tRCD 占 用 2-3 个 时 钟 周期 。 如 图 13-14 所 示 。 


CLK 


COMMAND ( Ac 


< tRCD > 


图 13-14 ” ACT 命令 与 恋 、 写 命令 之 间 要 间隔 tRCD 时 间 


13.6.1.7 SDRAM 读 写 


当 行 地 址 选 定 ， 并 且 相 应 的 行 被 激活 后 ， 就 可 以 进行 读 操作 了 。 
读 操作 使 用 READ 或 READAP 命 令 ， 一般 是 突 发 读 ， 连 续 读 出 若干 个 
数据 。 第 一 个 数据 在 经 过 指定 的 CAS 延 时 后 会 出 现在 数据 线 上 ， 以 后 
每 个 时 钟 都 会 读 出 一 个 新 的 数据 ， 直 到 达到 设 定 的 突 发 长 度 。 


写 操 作 也 是 类 似 的 ， 使 用 WRITE 或 WRITEAP 命 令 ， 一般 是 突 发 
写 ， 连 续 写 入 若干 个 数据 。 第 一 个 要 写 入 的 数据 与 写 命 令 在 同一 时 间 
给 出 ， 以 后 每 个 时 钟 给 出 下 一 个 要 写 入 的 数据 ， 直 到 达到 设 定 的 突 发 
长 度 。 


需要 注意 的 是 ， 由 于 SDRAM 的 寻 址 具有 独占 性 ， 所 以 在 进行 完 
读 、 写 操作 后 ， 如 果 要 对 同一 Bank 的 另 一 行进 行 寻 址 ， 那 么 要 将 原来 
EX (工作 ) 的 行 关闭 ， 重 新 发 送行 / 列 地 址 。 可 以 使 用 预 充电 命令 
PRE 实 现 关 闭 现 有 工作 行 、 准 备 打开 新 行 的 操作 。 


13.6.1.8 SDRAM 的 时 间 人 参数 


在 SDRAM 的 使 用 中 ， 有 许多 时 间 参 数 需要 注意 ， 在 之 前 的 几 小 
节 中 也 提 到 过 一 些 ， 此 处 将 主要 的 时 间 参 数列 举 如 下 。 


(1) CL (CAS Latency) 


CL 表 示 CAS 延 迟 ， 指 的 是 从 READ 命 令 发 出 到 第 一 次 数据 输出 之 
间 的 时 间 ， 通 常设 定 为 2 或 3 个 时 钟 周 期 。 


(2) tWR (Write Recovery time) 


tWR 表 示 写 入 /矫正 时 间 : 在 执行 写 操 作 时 ， 数 据 并 不 是 即时 地 与 
入 存储 电容 ， 因 为 选 通 三 极 管 与 电容 的 充电 必须 要 有 一 段 时 间 ， 所 
以 ， 数 据 的 真正 写 入 要 有 一 定 的 周期 。 为 了 保证 数据 的 可 靠 写 入 ， 需 
要 留 出 足够 的 时 间 ， 也 就 是 此 处 的 twWR， 一 般 大 于 等 于 1 个 时 钟 周 期 。 


(3) tRAS (Active to Precharge Command) 


tRAS 表 示 ACT 命 令 与 预 充电 命令 之 间 的 时 间 间 隔 。 预 充电 命令 至 
少 要 在 行 有 效 命 令 5 个 时 钟 周 期 后 发 出 ， 最 长 间隔 视 心 片 而 异 ， 否 则 工 
作 行 的 数据 有 丢失 的 危险 。 


(4) tRCD (RAS to CAS Delay) 

参考 13.6.1.6 小 节 。 

(5) tRP (Precharge Command Period) 

预 充 电 命 令 后 ， 需 要 相隔 tRP 时 间 ， 才 可 以 打开 新 的 行 。 


(6) tRC (Row Cycle time) 


tRC 表 示 SDRAM 行 周期 时 间 ， 它 是 包括 行 预 充电 到 激活 在 内 的 整 
个 过 程 所 需要 的 最 小 时 钟 周期 数 。 一 般 而 言 ，tRC = tRAS +tRPo 


(7) tREF (Refresh Period) 


tREF 是 刷新 周期 ，SDRAM 需 要 定期 进行 刷新 ， 以 维持 原 有 信 
息 ， 存 储 体 中 电容 的 数据 有 效 保存 期 的 上 限 是 64ms， 也 就 是 说 每 一 行 
刷新 的 循环 周期 最 多 是 64ms， 刷 新 速度 的 计算 方法 是 : 行 数 


=/64mso 


13.6.2 SDRAM CONTROLLER IP 
核 


通过 上 面 的 学 习 ， 读 者 朋友 可 能 觉得 SDRAM 很 复杂 ， 是 的 ， 是 
很 复杂 ， 不 过 我 们 并 不 需要 直接 操作 SDRAM， 可 以 通过 SDRAM 控 制 
器 进行 ， 如 图 13-3 所 示 ，SDRAM 控 制 器 位 于 总 线 与 SDRAM 之 间 ， 从 
总 线 接收 访问 请 求 ， 然 后 转化 为 SDRAM 的 操作 命令 ， 将 操作 结果 传 
弟 回 总 线 。 而 SDRAM 控 制 器 有 开源 的 IP 核 可 以 使 用 。 本 章 建立 的 小 型 
SOPC 中 使 用 的 就 是 OpenCores 站 点 提供 的 开 产 SDRAM 探 制 器 一 一 
SDRAM CONTROLLER。 用 户 只 需要 根据 自己 实际 的 SDRAM 心 片 ， 
配置 该 IP 核 的 一 些 参 数 即 可 。 


读者 可 以 在 OpenCores 站 点 下 载 该 IP 核 的 源 代码 ， 也 可 以 直接 在 本 
书 附带 光盘 的 Code\Chapterl3\sdram_controller 目 录 下 找到 所 有 源 代 
码 。 另 外 ， 本 书 附 带 光盘 的 Doc 目 录 下 提供 了 该 人 P 核 的 说 明 手 册 。 
SDRAM CONTROLLER 具 有 以 下 特点 。 


支持 SDRAM 的 数据 总 线 宽度 可 以 为 8、16、32。 

列 地 址 宽度 可 配置 。 

支持 4 个 Bank 的 SDRAM。 

CAS 延 迟 可 配置 。 

支持 数据 掩 码 ， 从 而 实现 “部 分 写 ” 操 作 (Partial Write 
Operation) 。 

自动 控制 刷新 。 

支持 所 有 标准 的 SDRAM 功 能 。 

。 支持 Wishbone BARA. 


该 卫 核 的 接口 可 以 分 为 两 类 ， 一 类 是 wishbone 总 线 侧 的 接口 ， 另 
一 类 是 SDRAMI 片 侧 的 接口 ， 分 别 如 表 13-17、 表 13-18 所 示 。 


3213-17 SDRAM CONTROLLER IP 核 的 wishbone 总 线 接口 信号 


序 号 接口 名 宽度 (bit) 输入 /输出 E 用 
wb_clk i 1 输入 Wishbone 总 线 时 钟 信号 


z 周期 类 型 识别 地 址 标签 , 是 Wishbone B3 版 本 
ll wb cti i 3 输入 ties ay 
AAG as 


3213-18 SDRAM CONTROLLER IP 核 的 DRAM 接 口 信 号 


I ij 
N) 
Of 
N) 
Jill 
Tae 


A 
从 
wb we i 1 MA Wishbone 总 线 写 使 能 信号 
wb sel i 4 MA Wishbone 总 线 字 节 选择 信号 
A 


ae (it E O T 
mr an | 


输出 时 钟 使 能 人 

片 选 ， 低 电 平 有 效 

行 地 址 选 通信 号 ， 低 电 平 有 效 

列 地址 选 通信 号 ， 低 电 乎 有 效 

写 操作 信号 ， 低 电 平 有 效 

字 节 选择 和 输出 使 能 ， 低 电 平 有 效 ， 默 认 宽 
度 为 2 


数据 总 线 ， 默 认 宽 度 是 16 
SDRAM 初始 化 完毕 信号 ， 为 1 表示 初始 化 
se 


sdr init done | 1 


表 13-18 中 的 信号 与 表 13-14 中 SDRAM 世 片 的 接口 是 一 一 对 应 的 ， 
在 使 用 的 时 候 ， 只 需要 将 对 应 的 接口 连接 起 来 即 可 。 需 要 说 明 两 点 。 


(1) 数据 总 线 的 宽度 是 可 配置 的 ， 默 认 是 16， 还 可 以 配置 为 8、 
320 


(2) sdr_init done 是 一 个 比较 特别 的 信号 ， 用 来 指出 SDRAM 是 

否 初 始 化 完毕 ， 也 就 是 说 ， 该 SDRAM CONTROLLER IP 核 具有 

SDRAM 初 始 化 功能 ， 用 户 不 需要 按照 13.6.1.4 小 节 中 的 说 明 自 己 初始 

化 SDRAM， 只 需要 等 待 sdr_init_done 变 为 1 即 可 ， 此 时 的 SDRAM 就 已 
经 初始 化 完毕 了 


除了 上 面 的 接口 外 ， 要 使 用 该 IP 核 ， 还 需要 配置 一 些 参 数 ， 如 表 
13-19 所 示 。 


表 13-19 SDRAM CONTROLLER IP 核 的 一 些 配置 参数 


序号 | eke 宽度 (vit) 作用 
1 cfg_sdr_width 2 SDRAM 的 数 


ti} tt ty 


据 总 线 宽 度 : 
00 一 一 32 位 
SDRAM, 
01 一 一 16 位 
SDRAM 


1x. 8 位 
SDRAM 


SDRAM 控 制 


cfg_sdr_en re 
器 使 能 信号 


列 地 址 宽度 : 


00——8bit 
01——9bit 
10——10bit 
11——11bit 


13 模式 寄存 器 


时 间 tRAS 的 
值 ， 单 位 是 时 
钟 周期 


cfg_colbits 


cfg_sdr_mode_reg 


cfg_sdr_tras_d 


时 间 tRP 的 


Eh 


值 ， 单 位 是 时 
钟 周期 


cfg_sdr_trp_d 


时 间 tRCD 的 
值 ， 单 位 是 时 
钟 周期 


时 间 CL 的 


Eh 


| 


cfg_sdr_trcd_d 


cfg_sdr_cas 


EERE 


一 一 


cfg_sdr_trcar_d 
0 cfg_sdr_twr_d 


cfg_sdr_rfsh 


cfg_sdr_rfmax 
cfg_req_depth 


从 表 13-19 可 知 ， 为 了 使 用 SDRAM CONTROLLER IP 核 ， 需 要 配 
置 很 多 参数 ， 这 些 参数 都 是 与 具体 的 SDRAM 必 片 有 关 ， 可 以 查询 对 
应 的 芯片 手册 。 本 章 设计 的 小 型 SOPC 将 在 DE2 开 发 平台 上 运行 ， 在 
DE2 上 有 一 个 8MB 的 SDRAM ， 型 号 是 Zentel 公 司 的 A3V64S40ETP- 
G6， 数 据 宽度 是 16 位 ， 有 4 个 Bank， 针 对 该 型 SDRAM， 设 置 SDRAM 
CONTROLLER IP 核 的 配置 参数 如 表 13-20 所 示 。 


值 ， 单 位 是 时 
钟 周 期 


时 间 tRC 的 
值 ， 单 位 是 时 
钟 周期 


时 间 tWR 的 
值 ， 单 位 是 时 


钟 周期 


自动 刷新 命令 
之 间 的 时 间 间 
隔 ， 单 位 是 时 
钟 周期 


每 次 刷新 的 最 
大 行 数 


请 Ben 


TEET 


AL 
pi 


表 13-20 “针对 A3V64S40ETP-G6 的 配置 参数 


序号 | 参数 名 宽度 (bit) 配置 值 
4 cfg_sdr_mode_reg | 13 | 130000000110001 | 
cfg_sdr_tras_d 4 lo | 
cfg_sdr_trp_d 4 oo | 
cfg_sdr_trcd_d 4 oo | 
cfg_sdr_cas 3 EST 
cfg_sdr_trcar_d 4 CO 


pa 


cfg_sdr_twr_d 


=. 


cfg_sdr_rfsh 


| 一 


cfg_sdr_rfmax 


pa 


N ul 


cfg_req_depth 


ALFILER: 


(1) 模式 寄存 器 配置 为 13b0000000110001， 表 示 CAS 延 迟 为 3 个 
时 钟 周 期 ， 突 发 长 度 为 2 (一 次 读 出 16bit，2 次 正好 32bit) ， 突 发 模式 
是 线性 (Linear) 。 


(2) 参数 cfg_sdr cas 是 CAS 延 迟 的 值 ， 应 该 等 于 模式 寄存 器 中 配 
置 的 值 ， 但 是 笔者 在 实验 的 过 程 中 发 现 该 值 不 能 等 于 模式 寄存 器 中 配 
置 的 值 ， 而 是 要 比 后 者 的 值 大 1， 所 以 此 处 设置 为 3b100。 


(3) A3V64S40ETP-G6 心 片 的 每 个 Bank 有 4096 行 ， 此 处 设置 每 次 
刷新 的 最 大 行 数 cfg_sdr_ rfmax 为 4， 所 以 在 64ms 内 要 求 有 1024 次 刷 
新 ， 每 次 刷新 之 间 的 时 间 间 隔 是 (64/1024)ms。 另 外 ， 小 型 SOPC 计 划 
使 用 DE2 开 发 平台 上 提供 的 27MHz 时 钟 源 作为 工作 时 钟 ， (64/1024) 
ms 即 大 约 1688 个 时 钟 周 期 ， 所 以 设置 cfg_sdr rfsh 为 
12'b011010011000。 


13.7 ”实现 基于 实践 版 OpenMIPS 
的 小 型 SOPC 


现在 ，OpenMIPS 处 理 器 、Wishbone 总 线 互联 矩阵 、GPIO 模 块 、 
UARI 控 制 器 、Flash 控 制 器 、SDRAM 控 制 器 都 已 经 准备 好 了 ， 要 实现 
在 本 章 一 开始 设计 的 小 型 SOPC， 只 需要 将 这 些 模块 连接 起 来 即 可 ， 为 
此 ， 修 改 openmips_min_sopc.v 文 件 如 下 ， 源 文件 位 于 本 书 附带 光盘 中 
Code\Chapter13 目 录 下 。 


module openmips_min_sopc( 


input wire clk, 


input wire rst, 


// 新 增 UART 接 口 


.Wh 


stb_i(s0_stb_o), .wb_ack_o(s0_ack_i), 


.wb_addr_i((s0_addr_o[25:2],2'b00)), 
.wb_we_i(s0_we_0), .wb_dat_i(s0_data_o), 
.wb_sel_i(s0_sel_0), .wb_dat_o(s0_data_1), 
.wb_cyc_i(s@_cyc_o), .wb_cti_i(3'b000), 


// 与 小 型 SOPC 外 部 接口 相连 ， 对 外 连接 SDRAM 


.sdr 
.sdr 
.sdr 
.sdr 
.sdr 


.Sdr 


am_clk(clk), .sdram_resetn(-rst), 
sesen(sdr cs 120), .sdr_cke(sdr_cke_o), 
_ras_n(sdr_ras_n_o), .sdr_cas_n(sdr_cas_n_o), 
_we_n(sdr_we_n_o), .sdr_dqm(sdr_dqm_o), 
_ba(sdr_ba_o), .sdr_addr(sdr_addr_o), 
_dq(sdr_dq_io), 


// SDRAM 控 制 器 的 一 些 配置 ， 参 考 表 13 -20 


.cfg 
.cfg 
.cfg 
.cfg 
.cfg 


.cfg_ 


.cfg 
.cfg 


// S 


. sdr 


); 


_sdr_width(2'b01), .Cfg_colbits(2'b00), 
_req_depth(2'b11), .cfg_sdr_en(1'b1), 
sdr_mode_reg(13'b0000000110001), 


sdr_tras_d(4'b1000), .cfg_sdr_trp_d(4'b0010), 


sdr_trcd_d(4'b0010), .cfg_sdr_cas(3'b100), 


sdr_trcar_d(4'b1010), .cfg_sdr_twr_d(4'b0010), 


_sdr_rfsh(12'b011010011000), 
_sdr_rfmax(3'b100) 


DRAM 初 始 化 完毕 信号 ， 通 过 GPI0 的 输入 接口 传 给 处 理 器 


_init_done(sdram_init_done), 


// 从 设备 接口 14 


‚s14_data_i(), .s14_data_o(), 
.s14_addr_o(), .s14_sel_o(), 
.s14_we_o(), .s14_cyc_o(), 
.s14_stb_o(), .s14_ack_i(1'b0), 
.514 err_i(1'b0), .s14 rty_i(1'b0), 


// 从 设备 接口 15 


.s15_data_i(), .s15_data_o(), 
.s15_addr_o(), .s15_sel_o(), 
.s15_we_o(), .s15_cyc_o(), 
.s15_stb_o(), .s15_ack_i(1'b®), 
.s15_err_i(1'b0), SS Pty AL bo) 
); 

endmodule 


上 述 代码 虽然 比较 长 ， 但 是 并 不 复杂 ， 主 要 是 例 化 各 个 模块 ， 并 
按照 图 13-5 所 示 的 方式 连接 起 来 ， 可 以 分 为 六 段 理解 。 


第 一 段 : 例 化 了 实践 版 OpenMIPS 处 理 器 ， 其 中 将 数据 Wishbone 总 
线 接口 连接 到 WB_CONMAX 的 主 设备 接口 0， 将 指令 Wishbone 总 线 接 
口 连接 到 WB_CONMAX 的 主 设 备 接口 1。 另 外 ， 中 断 输入 信号 不 仅 包 


括 时 钟 中 断 ， 还 增加 了 UART 中 断 、GPIO 中 断 ， 分 别 来 自 UART 控 制 
器 、GPIO 模 块 。 


FIR: 例 化 了 GPIO 模 块 ， 将 其 连接 到 WB_CONMAX 的 从 设备 
接口 2。 另 外 ，GPIO 模 块 的 输入 信号 是 gpio i temp， 其 第 16bit 是 
SDRAM 控 制 器 的 输出 信号 sdram_init_done， 这 样 做 的 目的 是 : 处 理 器 
可 以 通过 读 取 GPIO 的 输入 值 ， 判 断 其 第 16bit 是 否 为 1， 从 而 知道 
SDRAM 是 否 初 始 化 完毕 。 


REC 例 化 了 Flash 控 制 器 ， 将 其 连接 到 WB_CONMAX 的 从 设 
备 接口 3。 


第 四 段 : 例 化 了 UART 控 制 器 ， 将 其 连接 到 WB_CONMAX 的 从 设 
备 接口 1。 注 意 ，UARTIT 控 制 器 的 串 行 接口 部 分 只 使 用 了 收 、 发 两 个 接 
口 ， 其 他 接口 (例如 : RTS、CTS 等 流 控 制 接口 ) 都 没有 使 用 。 


BAR: 例 化 了 SDRAM 控 制 器 ， 将 其 连接 到 WB_CONMAX 的 从 
设备 接口 0。 其 中 wb_cti i 是 Wishbone B3 版 本 才 添 加 的 信号 ， 此 处 并 不 
使 用 ， 直 接 设置 为 3b000 即 可 。 另 外 ，SDRAM 控 制 器 的 参数 配置 是 参 
考 表 13-20 设 置 的 ， 针 对 的 是 A3V64S40ETP-G6 芯 片 。 读 者 如 果 使 用 其 
他 型 号 的 SDRAM 心 片 ， 那 么 需要 根据 心 片 的 实际 情况 修改 此 处 的 参 
数 配 置 。 


第 六 段 : 例 化 了 WB_CONMAX。 只 使 用 了 主 设备 接 口 0、1， 以 
及 从 设备 接口 0、1、2、3， 其 余 接 口 都 没有 使 用 。 


通过 上 述 代 码 ， 可 以 得 到 本 章 设 计 的 基于 实践 版 OpenMIPS 的 小 型 
SOPC 的 接口 如 图 13-15 所 示 ， 详 细 说 明 参 考 表 13-21。 


clk sdr_clk_o 


rst sdr cs no 
, sdr cke o 
uart_in ees a 
= sdr ras no 
uart_out iain 
sdr cas n 0 
gpio i sdr we hn o 
gpio 0 sdr_dqm_o 
sdr_ba_o 
Hash ave i sdr addr o 
flash oe o sdr_dq_io 
flash_addr_o 
flash_ce_o 
flash rst 0 
flash data 1 


图 13-15 ”基于 实践 版 OpenMIPS 的 小 型 SOPC 的 接口 


表 13-21 ”基于 实践 版 OpenMIPS 的 小 型 SOPC 的 接口 描述 


in Ni 
pa feo | 


clk 1 输入 

n GPIO 输入 信和 

fiili Flash 输出 使 能 信号 ， 低 电 平 有 效 
8 flash addr o | 22 an tlt Flash 地 址 信号 


9 flash_ce_o 32 fili Flash 片 选 信号 ， 低 电 平 有 效 
1 
1 


flash data i | 8 从 Flash 读 出 的 数据 


E 
nl SDRAM I PH 
sani SDRAM JPEE S, EAA 
iil SDRAM 时 钟 使 能 信号 

sdr ras no 输出 SDRAM 行 地 址 选 通信 号 ， 低 电 平 有 效 

sdr cas no Dun SDRAM 列 地 址 选 通信 号 ， 低 电 平 有 效 

sdr we n o | SDRAM 写 操作 信号 ， 低 电 平 有 效 

sdr dqm _o antl} SDRAM 字 节 选择 和 输出 使 能 ， 低 电 平 有 效 
SDRAM 的 Bank 选择 信号 


sdr dq io SDRAM 数据 总 线 


138 ”本 章 小 结 


为 了 验证 实践 版 OpenMIPS 处 理 器 是 否 实现 正确 ， 本 章 搭建 了 基于 
实践 版 OpenMIPS 处 理 器 的 小 型 SOPC。 该 SOPC 包 括 GPIO、UART 控 制 | 
器 、Flash 控 制 器 、SDRAM 控 制 器 等 模块 ， 这 些 模块 都 具有 Wishbone 
总 线 接口 ， 与 OpenMIPS 处 理 器 一 起 挂 接 在 Wishbone 总 线 上 ， 便 于 处 理 
器 访问 。 此 外 ， 这 些 模 块 中 的 大 多 数 都 是 采用 已 有 的 开源 IP 核 ， 只 
Flash 控 制 器 是 自行 设计 的 。 下 一 章 将 在 该 SOPC 之 上 运行 测试 程序 ， 
进行 检验 。 


第 14 章 ”验证 实践 版 OpenMIPS 处 
ar 


上 一 章 设 计 实 现 了 基于 实践 版 OpenMIPS 处 理 器 的 小 型 SOPC ZS 
章 将 把 该 小 型 SOPC 下 载 到 实际 的 FPGA 芯 片 ， 并 运行 测试 程序 ， 通 过 
检验 测试 程序 的 执行 效果 ， 验 证 实践 版 0penMIPS 处 理 器 是 否 实现 正 
确 。 


首先 简单 介绍 了 要 用 到 的 开发 平台 DE2， 由 于 DE2 上 的 FPGA 心 片 
是 Altera 公 司 的 CycloneII 系 列 ， 所 以 需要 使 用 QuartusII 这 个 软件 来 建立 
工程 ，14.3 节 给 出 了 QuartusII 工 程 的 建立 方法 ， 同 时 说 明了 小 型 SOPC 
的 接口 与 FPGA 心 片 引 脚 的 对 应 关系 。14.4 节 说 明了 测试 步骤 。14.5 节 
进行 了 GPIO 实 验 ，14.6 节 进行 了 UART 实 验 ，14.7 节 是 一 个 综合 实验 ， 
其 模拟 了 操作 系统 的 加 载 过 程 。 


有 的 读者 朋友 可 能 会 抱 夭 ， 自 己 拥有 的 开发 平台 不 是 DE2， 没 关 
系 ， 步 又 都 是 相似 的 ， 大 家 可 以 参考 本 章 的 内 容 ， 在 自己 的 开发 平台 
上 验证 、 使 用 OpenMIPS 处 理 器 。 


141 DE2 平 台 简 介 


DE2 是 Altera 公 司 针对 大 学 教学 及 研究 机 构 推出 的 FGPA 多 媒体 开 
发 平台 ， 提 供 了 丰富 的 外 设 及 多 媒体 特性 ， 其 核心 FPGA 心 片 是 Altera 
CycloneII 系 列 的 EP2C35F672。 开 发 平台 的 外 观 如 图 14-1 所 示 。 


DE2 的 主要 资源 列举 如 下 。 


(1) Altera Cyclone II 系列 FPGA 芯 片 EP2C35F672， 内 含 35000 个 
逻辑 单元 (LE) o 


(2) 主动 串 行 配置 器 件 EPCS16。 


(3) 板 上 内 置 用 于 编程 调试 的 USB Blaster， 支 持 JTAG 模 式 和 AS 
模式 。 


(4) 512KBÉJSRAM, 8MBÉY SDRAM, 4MBEYNOR Flasho 
(5) 具有 SD 卡 接口 、PS2 接 口 。 
(6) 具有 红外 IrDA 收 发 器 。 


(7) 4 个 按键 、18 个 拨 动 开关 、8 个 绿色 LED 灯 、18 个 红色 LED 
灯 ， 以 及 8 个 7 段 数码 管 。 


(8) 板 载 50MHz、27MHz 两 个 晶振 可 选择 作为 系统 时 钟 ， 也 可 
使 用 外 部 时 钟 。 


(9) 24 位 CD 品质 音频 编 解 码 器 ， 带 有 麦克 风 输 入 插座 、 线 性 输 
入 插座 和 线性 输出 插座 。 


(10) VGA 数 模 转 换 器 ， 内 含 3 个 10 位 高 速 DAC。 
(11) 支持 NTSC 和 PAL 制 式 的 视频 解码 器 ADV7181B。 


(12) 10/100M 以 太 网 控制 器 DM9000AE 及 网 络 接口 。 


e ae TER 风 线 性 线性 视频 VGA 。 以 太 网 “RS232 
输入 输入 输出 输出 输出 接口 接口 


端口 端口 端口 

6 t t | | 1 | 1 t | 
p al pa 1 is m 4 = 

Bal A \ 


PN 
: > = nei ir f VGA 10bit DAC 
TV 解码 m na” j + 以 太 网 控制 器 
扩展 端口 2 
Altera USB 
Blaster 芯 片 组 aC 
EPCS16 配 置 器 件 
Altera Cyclone II 


a 
JTAG/AS 配 置 模子 EP2C35 FPGA 


选择 开关 
16x2LCD 模 块 SD+HHEHN 
7 段 数码 管 8 个 绿色 LED 


18 个 红色 LED 灯 IrDA 收 发 器 


18 个 拨 动 开关 


8MB 512KB 
SDRAM SRAM Flash 


图 14-1 DE2 开 发 平台 


SOMHz ihik 


(13) USB 主 从 控制 器 及 接口 。 
(14) RS-232 收 发 器 及 DB9 针 接口 。 
(15) 16x2 字 符 的 LCD 模 块 。 

(16) 两 个 40 针 脚 的 扩展 端口 。 


从 上 述 介绍 可 知 DE2 具 有 丰富 的 资源 ， 但 是 我 们 的 小 型 SOPC 只 是 
使 用 到 了 其 中 一 部 分 。 更 加 详细 的 说 明 可 以 参考 本 书 附 带 光 盘 中 Doc 
目录 下 的 PDF 文档 DE2_UserManul。 


14.2 ”测试 需要 的 硬件 连接 


测试 需要 的 硬件 连接 很 简单 ， 如 图 14-2 所 示 。PC 与 DE2 平 台 之 间 
只 需要 两 根 线 ， 一 根 连 接 PC 上 的 USB 接 口 与 DE2 上 的 USB Blaster 接 


口 ， 供 下 载 调试 使 用 。 另 一 跟 连 接 PC 上 的 串口 与 DE2 上 的 串口 ， 这 样 
小 型 SOPC 就 可 以 通过 串口 给 PC 发 送 数据 ，PC 也 可 以 通过 串口 给 小 型 
SOPC 发 送 数据 。 


串口 
DE2 


Blaster 


图 14-2 ”测试 需要 的 硬件 连接 


14.3 ”QuartusII 工 程 建 立 


针对 Altera 公 司 的 FPGA， 需 要 使 用 QuartusII 建 立 工程 ， 然 后 编译 
得 到 可 以 下 载 到 FPGA 上 的 配置 文件 。QuartusII 工 程 建立 步骤 如 下 。 


打开 QuartusII， 选 择 File->New Project Wizard， 如 图 14-3 所 示 。 


X, Quartus II 
Edt View Project Assignments Processing To 


E) New... 
=> Open... 


En New Project Wizard... 
= Open Project... 


图 14-3 ”使 用 “新 工程 向 导 ” 


会 出 现 如 图 14-4 所 示 的 对 话 框 ， 在 其 中 设置 工程 保存 路 径 、 工 程 
名 称 。 其 中 ， 工 程 名 称 可 以 设置 为 openmips_min_sopco 


€, New Project Wizard 


Directory, Name, Top-Level Entity [page 1 of 5] 


What is the working directory for this project? 
E:\openmips_min_sopc 
What is the name of this project? 


What is the name of the top-evel design entity for this project? This name is case sensitive and must exactly match the entity name in the design file. 
openmips_min_sopc 


Use Existing Project Settings... 


图 14-4 “设置 工程 保存 路 径 、 工 程 名 称 


单 击 Next 按 钮 ， 会 出 现 添加 文件 对 话 框 ， 如 图 14-5 所 示 。 单 击 File 
Name 后 面 的 省 略 号 按钮 ， 添 加 本 书 附带 光盘 中 Code\Chapter13 目 录 下 
的 所 有 文件 。 


Y New Project Wizard 


Add Files [page 2 of 5] 


Select the design files you want to include in the project. Click Add All to add all design files in the project directory to the project. 
Note: you can always add design files to the project later. 


File name: || 


Type Library Design Entry/Synthesis Tool HDL Version 


Default 
wb_conmax_top.v pa Default 
wb_conmax_slave_if.v il... Default 
wb_conmax_rf.v ur Default 
wb_conmax_pri_enc.v as Default 
wb_conmax_pri_dec.v de Default 
wb_conmax_msel.v il... Default 
wb_conmax_master_if.v Es Default 
wb_conmax_defines.v i. Default 
wb_conmax_arb.v En Default 
wb2sdrc.v il... Default 
uart_wb.v il... Default 
uart_transmitter.v il... Default 
uart_top.v il... Default 
uart_tfifo.v 机 Default 
uart_sync_flops.v il... Default 
uart_rfifo.v ER Default 
uart_regs.v il... Default 
uart_receiver.v il... Default 
uart_defines.v ker Default 
uart_debug_if.v ls Default 
timescale.v il... Default 
sync_fifo.v S Default 
stdlib.vhd e Default 
sdrc_xfr_ctl.v il... Default 
sdrc_top.v BS Default 
sdrc_req_gen.v ‘as Default 

ee da 


Specify the path names of any non-default libraries. 


图 14-5 “添加 光盘 Code\Chapter13 目 录 下 的 所 有 文件 


单 击 Next 按 钮 ， 会 出 现 器 件 选择 对 话 框 ， 如 图 14-6 所 示 ， 在 其 中 
选择 目标 平台 FPGA 心 片 的 型 号 ， 针 对 DE2 平 台 ， 此 处 选择 CycloneII 系 
列 的 EP2C35F672C6 作 为 目标 器 件 ， 


€, New Project Wizard 


Family & Device Settings [page 3 of 5] 
Select the family and device you want to target for compilation. 


Device family Show in ‘Available devices' list 


Family: |Cydone II Package: Any 


Devices: |All Pin count: Any 

Target device Speed grade: |Any 

© Auto device selected by the Fitter Show advanced devices 
©® Specific device selected in ‘Available devices’ list HardCopy compatible only 


Available devices: 


Name Core Voltage LEs User I/Os ow Bits Embedded multiplier 9-bit elements PLL (afad 
EP2C35F48418 1.2V 33216 322 
AO ln m use Un. 
EP2C35F672C7 LN 
EP2C35F672C8 1.2V 
EP2C35F672I8 1.2V 
EP2C35U484C6 1.2V 
EP2C35U484C7 1.2V 


|< 


\383333383 


Er ion devi ice 
HardCopy 


Limit DSP & RAM to HardCopy device resources 


图 14-6 ”选择 目标 平台 上 FPGA 世 片 的 型 号 


然后 一 直 单 击 Next 按 钮 ， 在 最 后 一 步 单 击 Finish 按 钮 ， 这 样 就 建立 
了 QuartusII 工 程 。 单 击 工 具 栏 上 的 Start Compilation 按 钮 ， 将 编译 整个 
工程 ， 如 图 14-7 所 示 。 


Start Compilation 


HAL IG Dr Heh OO 


图 14-7 ”点击 Start Compilation 按 钮 将 编译 整个 工程 


编译 会 持续 5~10 分 钟 左右 的 时 间 ， 编 译 完成 之 后 ， 可 以 进行 引 脚 
配置 了 ， 单 击 Assignments->Pin Planner 荣 单 选项 ， 如 图 14-8 所 示 。 


Tools Window Help 


=F $ Settings... Ctrl +Shift+£ 


EE - TimeQuest Timing Analyzer Wizard... 
吕 2 openmips.v | 
Eo mem_wb.v ¡2 Assignment Editor Ctrl +Shift+A 
i RAS 
站 ae eg. Remove Assignments... 

kare i} Back-Annotate Assignments... 


abg id mse as 
14-8 点 击 Pin Planner 进 行 引 脚 配 置 


出 现 引 脚 配置 窗口 ， 如 图 14-9 所 示 。 在 其 中 将 小 型 SOPC 的 各 个 接 
口 与 FPGA 心 片 的 引 肢 对 应 起 来 。 


Y Pin Planner - F: /YerilogHDL/Open¥IPS/Chapterl4/opennips min sopc/opennips min sopc — ... DAR 
Fie Edit View Processing Tools Window 
| Groups 
Named: * | 
Node Name Direction VREF Group 1/0 Standard 

-| & E) flash_addr_o[21..0] Output Group 3.3-V LV...default) 

3 DD flash_data_i[7..0] Input Group 3.3-V LV...default) 

SD gpio_i[15..0] Input Group 3.3-V LV...default) 

由 D gpio_o[31..0] Output Group 3.3-V LV...default) 

由 -二 sdr_addr_o[12..0] Output Group 3.3-V LV...default) 

+) $ sdr_ba_o[1..0] Output Group 3.3-V LV...default) 

+ 二 scr_da_io[15..0] Bidir Group 3.3-V LV...default) 

® sdr_dqm_o[1..0] Output Group 3.3-V LV...default) 
<<new group>> 


Named;| = y [RoJedit: A Y 

| Node Name Direction 
(D dk Input 

£ fash_addr_o[21] Output 

[4 flash_addr_o[20] Output 

[© flash_addr_o[19] Output 

|) flash_addr_o[18] 

|< fiash_addr_of17] 

|< flash_addr_o[16] 

|< flash_addr_o[15] 

[© fiash_addr_o[14] 

|< fiash_addr_o[13] 

2 flash_addr_o[12] 

[© fiash_addr_o[11] 
| fash_addr o[10] 
|© fiash_addr_o[9] 
2 fiash_addr _o[8] 
£ [29 flash_addr_o[7] 
= |< 
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214-9 5 引 脚 配置 窗口 


从 第 13 章 的 图 13-15 可 知 ， 小 型 SOPC 的 接口 有 五 类 : 系统 接口 
(复位 rst、 时 钟 dk) 、GPIO 接 口 (输入 gpio i、 输 出 gpio_0) 、 


UART 接 口 (接收 uart in、 发 送 uart out) 、Flash 接 口 、SDRAM 接 
口 ， 分 别 连 接 DE2? 平 台 的 如 下 资源 。 


。 时 钟 接口 clk 连 接 到 DE2 上 的 27MHz 时 钟 源 。 

。 复位 接口 rst 连 接 到 DE2 上 的 拨 动 开关 SW17， 也 就 是 图 14-1 
中 ， 左 下 角 的 那个 拨 动 开关 。 

。 GPIO 输 入 接口 gpio ji 连 接 到 DE2 上 的 16 个 拨 动 开关 SW0- 
SW15。 

。 GPIO 输 出 接口 gpio_o 连 接 到 DE2 上 的 4 个 7 段 数 码 管 。 

。 UART 接 口 与 DE2 板 上 的 UART 收 、 发 端口 一 一 对 应 。 

e Flash 接 口 与 DE2 板 上 的 Flash 心 片 的 引 肢 一 一 对 应 。 

e SDRAM 接 口 与 DE2 板 上 的 SDRAM 忌 片 的 引 肢 一 一 对 应 。 


上 述 连接 如 图 14-10 所 示 。 


27MHz 时 钟 源 一 一 > clk sdr_clk o ++ 

拨 动 开关 SW17 — rst sdr_cs no —> 

k — 1 

串口 接收 — uart_in pis i MAA 
串口 发 送 < uart_out sdr ras no 

sdr cas no Pp» 


sdr weno Pp» 
sdr dqm o > 
sdr bao Pp» 
sdr_addr_o Pp» 
sdr dq io “<> 


拨 动 开关 SW0-SW15 一 一 > gpio i 
4 个 7 段 数码 管 «—— gpio_o 


AFG? VAS 


<M flash_we_o 
< | flash_oe_o 
flash_addr_o 
< | flashceo 
< flash_rst_o 
— y flash_data_i 


图 14-10 “小 型 SOPC 与 DE2 平 台 资 源 的 连接 关系 


AFC YSB] 


配置 完 引 脚 后 ， 再 次 编译 该 QuartusII 工 程 ， 得 到 可 以 下 载 到 FPGA 
中 的 配置 文件 openmips_min_sopc.sof。 同 时 得 到 编译 报告 ， 显 示 资 源 
占用 情况 ， 如 图 14-11 nr. EX BN Ht A 
Code\Chapterl4\openmips_min_sopc 目 录 下 提供 了 完整 的 QuartusII 工 
程 。 


‘Flow Status: Successful - Tue Apr 15 18:06:48 2014 
Quartus II Version 10.1 Build 197 01/19/2011 SP 15) Full Version 
Revision Name openmips_min_sopc 
Top-evel Entity Name openmips_min_sopc 
Family Cyclone II 
Device EP2C35F672C6 
Timing Models Final 
=) Total logic elements 10,831 / 33,216 (33 %) 
Total combinational functions 10,269 / 33,216 (31%) 
Dedicated logic registers 4,363 / 33,216 (13%) 
Total registers 4363 
Total pins 125 / 475 (26 % ) 
Total virtual pins 0 
Total memory bits 256 / 483,340 (< 1%) 
Embedded Multiplier 9-bit elements  8/70(11%) 
Total PLLs 0/4(0%) 


图 14-11 小 型 SOPC 的 资源 占用 情况 


14.4 ”测试 步骤 说 明 


上 一 节 编 译 得 到 了 可 以 下 载 到 FPGA 中 的 配置 文件 
openmips_min_sopc.sof， 但 先 别 着 急 下 载 ， 因 为 小 型 SOPC 是 从 Flash 启 
动 的 ， 而 此 时 Flash 中 并 没有 测试 程序 。 正 确 的 测试 步骤 如 图 14-12 所 
To 


1 编写 测试 程序 


y 


2 编译 测试 程序 ， 得 到 二 进 制 文件 


v 
=, 


制 文件 写 入 Flash 


3 An FE AS EY NN 


4 将 配置 文件 openmips_min_sopc.sof 下 载 到 FPGA | 
5 | 复位 OpenMIPS | 
6 | 开始 运行 


图 14-12 ”正确 的 测试 步骤 


其 中 第 3 步 “ 将 编译 得 到 的 二 进 制 文件 写 入 Flash” 是 通过 以 下 两 小 
步 实 现 的 。 


(1) 将 DE2 开 发 平台 附带 光盘 提供 的 配置 文件 DE2_USB_APTI.sof 
下 载 到 FPGA。 本 书 附 带 光盘 中 的 DE2 文 件 夹 下 也 提供 了 该 文件 。 


(2) 打开 DE2 开 发 平台 附带 光盘 提供 的 程序 
DE2_Control_Panel.exe， 本 书 附 带 光盘 的 DE2 文 件 夹 下 也 提供 了 该 程 
序 。 使 用 该 程序 首先 Erase Flash， 然 后 再 将 测试 程序 对 应 的 二 进 制 文 
45 AFlasho 


需要 先 Erase Flash， 然 后 再 写 Flash， 这 是 由 Flash 的 特性 决定 的 ， 
Flash 可 以 将 一 个 bit 从 1 变 为 0， 但 是 不 可 以 从 0 变 为 1， 所 以 只 有 先 通过 
Erase 操 作 ， 将 其 全 部 变 为 1 后 ， 再 写 入 。 


图 14-12 中 ， 第 5 步 的 复位 操作 ， 实 际 就 是 将 挨 动 开关 SW17 向 上 
拨 ， 使 得 相应 输入 为 高 电 平 ， 该 开关 连接 到 SOPC 的 rst 接 口 ， 所 以 使 得 
rst 的 值 为 1。 


图 14-12 中 ， 第 6 步 的 启动 操作 ， 实 际 就 是 将 拨 动 开关 SW17 向 下 
拨 ， 使 得 相应 输入 为 低 电 平 ， 该 开关 连接 到 SOPC 的 rst 接 口 ， 所 以 使 得 
rst 的 值 为 0。 


以 上 就 是 正确 的 测试 步 又， 下 一 节 会 结合 GPIO 实 验 详细 说 明 各 个 
步骤 是 如 何 操作 的 。 本 书 其 余 的 实验 就 不 再 详 细 说 明 测 试 步 又 ， 只 是 
给 出 测试 代码 、 测 试 结果 。 


14.55 ”测试 一 一 GPIO 实 验 
145.1 ”测试 内 容 


本 测试 的 主要 内 容 是 OpenMIPS 处 理 器 控制 GPIO 的 输出 。 


在 14.3 节 介绍 引 脚 配置 的 时 候 提 到 GPIO 输 出 接口 gpio_o 与 4 个 7 段 
数码 管 相连 。 所 以 gpio_o 的 值 可 以 通过 7 段 数码 管 显示 出 来 。7 段 数码 
管 的 引 脚 与 数码 管 的 对 应 关系 如 图 14-13 所 示 。 如 果 某 一 引 脚 输入 电 平 
为 低 电 平 ， 那 么 对 应 的 数码 管 就 会 点 亮 ， 比 如 : 如 果 引 脚 a 输 入 低 电 
平 ， 那 么 最 上 面 的 数码 管 就 会 点 亮 。 
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图 14-13 7 段 数码 管 的 引 脚 与 数码 管 的 对 应 关系 


GPIO 输 出 接口 gpio_o 的 宽度 为 32 位 ， 含 4 个 字 节 ， 每 个 字 节 对 应 
一 个 数码 管 ， 而 每 个 数码 管 只 有 7 个 引 脚 ， 所 以 每 个 字 节 都 有 一 位 没有 
使 用 ， 此 处 统一 设置 为 每 个 字 节 的 最 高 位 没有 使 用 ， 如 图 14-14 所 示 。 
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图 14-14 ”gpio_o 接 口 与 4 个 7 段 数码 管 的 连接 示意 图 


14.5.2 ”测试 程序 


测试 程序 如 下 ， 源 文件 是 本 书 附带 光盘 中 Code\Chapterl4\gpio_test 
目录 下 的 inst_rom.S 文 件 。 


,Org 0x0 

.set noat 

,Set noreorder 
.set nomacro 


.global _start 


ori $1, $1,0x0004 
lui $2,0x4740 
ori $2,$2,0x4106 
sw $2,0x0($1) # 向 地 址 90x20000004 写 入 90x47404106 
# 0Xx20000004 对 应 GPI0 模 块 的 寄存 器 
RGPIO_OUT 


上 述 测试 程序 可 以 分 为 三 段 理 解 。 


第 一 段 : 向 地 址 0x20000008 写 入 0xffffffff ，GPIO 模 块 连接 到 
Wishbone 总 线 互 联 和 矩阵 的 从 设备 接口 2， 所 以 其 地 址 是 从 0x20000000 开 
始 ， 通 过 表 13-3 可 知 ， 偏 移 为 0x8 的 地 址 对 应 的 是 RGPIO_OE 寄 存 器 ， 
向 该 寄存 器 写 入 0xffffffff， 表 示 GPIO 的 32 个 输出 接口 都 使 能 。 


第 二 段 : 向 地 址 0x2000000c 写 入 0x00000000， 通 过 表 13-3 可 知 ， 
偏 移 为 0xc 的 地 址 对 应 的 是 RGPIO INTE 寄 存 器 ， 向 该 寄存 器 写 入 
0x00000000， 表 示 中 断 禁 止 。 


第 三 段 : 向 地 址 0x20000004 写 入 0x47404106 ， 通 过 表 13-3 可 知 ， 
偏 移 为 0x4 的 地 址 对 应 的 是 RGPIO_OUT 寄 存 器 ， 向 该 寄存 器 写 入 
0x47404106， 表 示 GPIO 输 出 的 信号 是 0x47404106。 


如 果 运 行 正确 ， 那 么 4 个 7 段 数码 的 显示 应 该 如 图 14-15 所 示 ， 黑 色 
表示 数码 管 被 点 亮 ， 显 示 “LOVE” 单 词 。 读 者 可 以 结合 图 14-13、 图 14- 
14， 理 解体 会 为 何 0x47404106 会 对 应 这 个 显示 结果 。 
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图 14-15 ”4 个 7 段 数码 管 的 预期 显示 效果 


14.5.3 ”编译 测试 程序 


现在 需要 编译 测试 程序 ， 将 上 述 inst_rom.S 文 件 ， 与 第 4 章 建 立 的 
Bin2Mem.exe、 Makefile、ram.ld 这 三 个 文件 复制 到 Ubuntu 虚 拟 机 中 的 
同一 个 目录 下 ， 打 开 终 端 ， 使 用 cd 命令 进入 该 目录 ， 然 后 输入 make 
all， 即 可 得 到 要 写 入 Flash 的 二 进 制 文件 inst_rom.bin。 


需要 注意 一 点 : 在 编译 前 要 修改 ram.1d 文 件 ， 将 其 中 的 起 始 地 址 
从 0x00000000 修 改 为 0x30000000， 如 下 ， 完 整 文件 位 于 本 书 附带 光盘 
中 Code\Chapter14\gpio_test 目 录 下 。 


MEMORY 


ram 


ORIGIN = 0x30000000 


, LENGTH = 0x00000300 
i 


做 此 修改 主要 是 因为 测试 程序 是 在 Flash 中 运行 的 ， 而 Flash 的 起 始 
地 址 就 是 0x30000000。 


14.5.4 ”将 测试 程序 写 入 Flash 心 片 


在 14.4 节 已 经 说 明 : 将 测试 程序 写 入 Flash 心 片 可 以 分 为 两 小 步 。 
1. 将 配置 文件 DE2_USB_APTI.sof 下 载 到 FPGA。 


2. 打开 程序 DE2 Control Panel.exe ， 使 用 该 程序 首先 Erase 
Flash， 然 后 将 编译 测试 程序 的 得 到 的 二 进 制 文件 写 入 Flash。 


具体 操作 步骤 如 下 。 


单 击 QuartusII 工 具 栏 上 的 Programmer 按 钮 ， 如 图 14-16 所 示 。 
Program mer 


Kr 982 07068» 


14-16 单 击 工具 栏 上 的 Programmer 按 钮 


出 现 Programmer 对 话 框 ， 如 图 14-17 所 示 。 单 击 “Change File...” 按 
钮 ， 选 择 DE2 附 带 光盘 提供 的 DE2_USB_API.sof 文 件 ， 本 书 附带 光盘 
的 DE2 目 录 下 也 提供 了 该 文件 。 选 中 其 中 的 “Program/Configure” 对 应 的 
复 选 框 ， 然 后 单 击 “Start”* 按 钮 ， 将 该 配置 文件 下 载 到 FPGA。 


Ù Programmer - E:/Altera/OpenMIPS_min_sopc - OpenMIPS_min_sopc — [OpenNIPS_min_sopc. cdf]* DER 
Eile Edit View Processing Tools Window 


..| [USB-Blaster [USB-0] | Mode: |JTAG “| Progress: 


to allow background programming (for MAX II and MAX V devices) 


File Device Checksum Usercode Program/ Verify Blank- Examine 
onfigure Che: 


Ci ck 
../DE2_USB_API.sof EP2C35F672 00644A3E FFFFFFFF | i 国 | 


14-17 ”Programmer 对 话 框 


下 载 完 成 后 ， 打 开 DE2 附 带 光 盘 或 本 书 附带 光盘 提供 的 
DE2_Control_Panel.exe 程 序 ， 选 择 Open 菜 单 ， 单 击 Open USB Port 03% 
项 ， 如 图 14-18 所 示 。 


DE) DE2 Control Panel 


GSA Help About 


| D&D | Toots 


| 
FLASH!" SDRAM SRAM | VGA | 


FLASH 
Random Access 


Address : (0 wDATA, : [oo (DATA: [00 
Sequential write 

Address: (0 Length : fo [ File Length 
Sequential Read 


Address: (0 Length: fo FT Entire Flash 


图 14-18 Open USB Port 


然后 选择 "FLASH” 这 个 Tab ， 单 击 Chip Erase f£ H, 4 Erase 
Flash， 该 过 程 大 约 需要 40 秒 的 时 间 。 如 图 14-19 所 示 。 


DE DE2 Control Panel 
Open Help About 


PS2 & 7-SEG | 


LED & LCD 
FLASH | 


SDRAM 
FLASH 
Random Access 


Address : lo wDATA: (00 (DATA : [00 


Processing 
HRS 


Sequential Read 


Address : 0 Length : (0 [ Entire Flash 


AAA 


图 14-19 Erase Flash 的 过 程 


Erase Flash 结 束 后 ， 可 以 将 测试 程序 写 入 Flash 了 ， 如 图 14-20 所 
示 ， 选 中 File Length 前 面 的 复 选 框 ， 单 击 “Write a File to FLASH” 按 


钮 ， 会 出 现 一 个 文件 选择 框 ， 在 其 中 选择 之 前 编译 得 到 的 inst_rom.bin 
文件 ， 就 会 将 该 文件 写 入 Flash。 


DE) DE2 Control Panel 
Open Help About 


PS2 & 7-SEG | LED & LCD | 
FLASH | SDRAM SRAM 


FLASH 
Random Access 


Address: pp wDATA : foo (DATA: [oo 
Chip Erase (40 Sec.) Write Read (1) 选中 File Length 


Sequential Write 


Address : (0 Length: (0 File Li == 
— (2) 点 击 该 按钮 ， 
Write a File to FLASH ===] 在 弹出 的 对 话 框 中 选 
择 要 写 入 的 bin 文 件 


Sequential Read 


Address: (0 Length: jp F Entire Flash 
Load FLASH Content to a File 


214-20 ”将 测试 程序 写 入 Flash 


最 后 ， 再 次 选择 Open 菜 单 ， 单 击 Close USB Port 选 项 。 如 图 14-21 
所 示 。 


DE DE2 Control Panel 


135% Help About 
Open USB Port 0 | LED&LCD | TOOLS | 


SDRAM sRaM | VGA 


图 14-21 Close USB Port 


14.55 ”下载 小 型 SOPC 到 DE2 


到 这 一 步 ， 已 经 将 测试 程序 写 入 Flash 了 ， 现 在， 可 以 向 FPGA 下 
载 我 们 早 在 14.3 节 就 已 编译 得 到 的 配置 文件 openmips_min_sopc.sof 了 。 
下 载 过 程 很 简单 ， 再 次 打开 QuartusII 的 Programmer 工 具 ， 选 择 在 14.3 


节 得 到 的 OpenMIPS_min_sopc.sof， 然 后 单 击 Start 按 钮 ， 就 将 该 配置 文 
件 下 载 到 FPGA 了 。 


14.5.6 ”测试 效果 


好 了 ， 小 型 SOPC 已 经 下 载 到 FPGA 了 ， 测 试 程序 也 已 写 入 Flash 
了 ， 只 需要 复位 一 下 SOPC， 然 后 就 可 以 运行 了 。 让 我 们 拨 动 开关 
SW17， 先 向 上 拨 一 下 ， 再 向 下 拨 一 下 。DE2 上 的 7 段 数码 管 会 呈现 如 
图 14-22 所 示 的 效果 。 这 证 明 我 们 的 实践 版 OpenMIPS 处 理 器 运行 正 
确 。 


图 14-22 ”小 型 SOPC 运 行 后 的 7 段 数码 管 显示 效果 


14.6 ”测试 二 UART 实 验 


14.6.1 ”测试 内 容 


本 测试 的 主要 内 容 是 OpenMIPS 处 理 器 通过 UART 输 出 数据 给 PC， 
输出 的 数据 从 0x01 依 次 递增 至 0xFF， 然 后 再 从 0x00 重 新 开始 。 


从 本 测试 开始 ， 不 再 给 出 详细 的 测试 步骤 ， 只 是 给 出 测试 程序 的 
说 明 、 测 试 效果 ， 而 详细 的 测试 步骤 可 以 参考 上 一 节 GPIO 实 验 。 


14.6.2 ”测试 程序 


测试 程序 如 下 ， 源 文件 是 本 书 附带 光盘 Code\Chapter14\uart_test 目 
录 下 的 inst_rom.S 文 件 。 


.Org 0x0 

.Set noat 

.Set noreorder 

.set nomacro 

.global _start 
_start: 

HAHAHA 第 = ES 

HEHEHE HEE 


lui $1,0x1000 

ori $1, $1, 0x0003 

ori $2, $0, 0x80 

sb $2,0x0($1) # 向 地 址 9x10000003 写 入 0x80 


一 个 数据 了 ， 
# 反之 ， 回 到 loop2， 等 待 发 送 完毕 
nop 
j _loop1 # 回 到 第 三 段 ， 发 送 下 一 个 数据 


nop 
上 述 代码 可 以 分 为 四 段 理 解 。 


第 一 段 : 初始 化 UART 控 制 器 ， 包 括 设 置 分 频 系 数 、 数 据 格式 
等 ， 有 三 小 步 。 


。 首先 ， 向 地 址 0x10000003 写 入 0x80，UART 控 制 器 连接 到 
Wishbone 总 线 互 联 矩 阵 的 从 设备 接口 1， 所 以 其 地 址 是 从 
0x10000000 开 始 ， 参 考 表 13-7 可 知 ， 地 址 0x10000003 对 应 的 
是 UART 控 制 器 的 Line Control Register ， 设 置 LCR 的 值 为 
0x80， 也 就 是 设置 LCR 的 最 高 位 为 1。 设 置 完 成 后 ， 地 址 
0x10000000、0x10000001 对 应 的 就 是 两 个 分 频 系数 寄存 器 。 
接着 ， 设 置 分 频 系 数 ， 此 处 设计 UART 的 疲 特 率 为 9600bps， 
系统 时 钟 为 27MHz ， 参 考 13.4.2 节 给 出 的 分 频 系 数 计算 公 
式 ， 得 到 分 频 系 数 =27000000/(16*9600)， 取 整 后 为 0xB0， 所 
以 设置 分 频 系 数 的 高 字 节 为 0x0， 低 字 节 为 0xB0。 

最 后 ， 设 置 LCR 的 值 为 0x03， 参 考 表 13-10 对 LCR 寡 存 器 的 说 
明 可 知 ， 此 处 就 是 设置 UART 收 、 发 数据 格式 为 8 位 数据 位 、 
没有 奇偶 校 验 位 、1 位 停止 位 。 


第 二 段 : 经 过 上 面 的 步骤 ，UART 控 制 器 已 经 初始 化 完毕 ， 可 以 
收 、 发 数据 了 。 本 段 将 寄存 器 $3 的 值 初始 化 为 0x0。 


第 三 段 : 这 一 段 是 通过 UART 发 送 数据 的 主 循环 ， 将 寄存 器 $3 的 
值 加 1， 然 后 将 寄存 器 $3 的 最 低 字 节 写 入 地 址 0x10000000， 参 考 表 13-7 
可 知 ， 地 址 0x10000000 对 应 的 是 UART 控 制 器 的 Transmitting Holding 
Register， 写 入 其 中 的 数据 会 被 UART 控 制 器 发 送出 去 。 


第 四 段 : 检查 UART 控 制 器 是 否 发 送 数据 完 毕 ， 如 果 发 送 完 毕 ， 
那么 回 到 第 三 段 ， 将 寄存 器 $3 加 1， 再 次 通过 UARIT 发 送 ， 否 则 ， 等 待 
数据 发 送 完毕 。 其 中 ， 检 查 是 否 发 送 完毕 的 方法 就 是 读 取 Line Status $ 
存 器 的 值 ， 参 考 表 13-11 可 知 Line Status 寡 存 器 的 第 5bit 是 发 送 FIFO 
空 标 志 ， 如 果 数 据 发 送 完毕 ， 那 么 会 设置 该 位 为 1。 


在 通过 UART 发 送 数据 时 注意 ， 昌 然 UART 控 制 器 具有 了 FIFO， 但 
是 最 好 也 不 要 连续 快速 发 送 数 据 ， 否 则 容易 发 生 FIFO 满 的 情况 ， 导 致 
数据 丢失 。 所 以 ， 在 测试 程序 中 ， 在 发 送 数据 前 都 要 先 判 断 发 送 FIFO 


14.6.3 ”测试 效果 


将 上 一 小 节 的 测试 程序 编译 后 ， 写 入 Flash， 然 后 下 载 14.3 节 得 到 
的 小 型 SOPC 的 配置 文件 到 FPGA， 详 细 步 又 可 以 参考 GPIO 实 验 。 


打开 串口 程序 ， 将 参数 设置 为 与 小 型 SOPC 的 一 样 ， 即 设置 疲 特 率 
为 9600bps、8 位 数据 位 、 没 有 奇偶 校 验 位 、1 位 停止 位 。 通 过 拨 动 开关 
SW17 复 位 OpenMIPS ， 然 后 启动 OpenMIPS， 串 口 程 序 会 得 到 如 图 14- 
23 所 示 的 结果 ， 其 中 显示 接收 到 的 数据 从 0x01 递 增 至 0xFF ， 然 后 又 从 
0x00 开 始 ， 可 知 UART 实 验 成 功 。 


LLL BR ae EAS OPC HE A — FY 


FARDE (CHM EN v3 1 


号 |COM1 v 
串口 号 02 03 04 05 06 07 08 09 OA OB OC OD OE OF 10 11 12 13 14 15 16 


ee [9600 ”| 18 19 1A 1B 1C 1D 1E IF 20 21 22 23 24 25 26 27 28 29 2A 2B 2C 

2F 30 31 32 33 34 35 36 37 38 39 3A 3B 3C 3D 3E 3F 40 41 42 

校 验 位 [NONE l 44 45 46 47 48 49 4A 4B 4C 4D 4E 4F 50 51 52 53 54 55 56 57 58 

数据 位 [et = SA 5B SC SD SE SF 60 61 62 63 64 65 66 67 68 69 GA BB 6C 6D SE 

71 72 73 74 75 76 77 78 79 TA TB TC TD TE TF 80 81 82 83 84 

停止 位 | 位 了 | 87 88 89 BA 8B 8C 8D SE SF 90 91 92 93 94 95 96 97 98 99 

9D 9E 9F AO Al A2 A3 A4 AS AB AT AB AS AA AB AC AD AE AF BO 

B3 B4 BS BG B7 ES B9 BC BD BE BF CO C1 C2 C3 C4 C5 

C8 C9 CA CB CC CD CE CF D2 D3 M4 DS DS D7 DS D9 DA DB DC 

DE DF EO El E2 E3 E4 ES ES E9 EA EB EC ED EE EF FO Fi 

F5 F6 FT FS F9 FA FB FE FF 00 01 02 03 04 05 06 07 

la OA OB OC OD OE OF 10 11 14 15 16 17 18 19 1A 1B IC 1D 

三 自动 换行 显示 20 21 22 23 24 25 26 27 2A 2B 2C 2D 2E 2F 30 31 32 33 

Y 十 六 进 制 显示 36 37 38 39 3A 3B 3C 3D 40 41 42 43 44 45 46 47 48 49 

三 暂停 接收 显示 4B 4C 4D 4E 4F 50 51 52 53 54 55 58 57 58 59 SA SB SC 5D SE SF 60 

— 62 63 64 65 66 67 68 69 GA GB 6C 6D GE GF 70 71 72 73 74 75 76 

保存 数据 清除 显示 78 79 TA TB TC TD TE TF 80 81 82 83 84 85 86 87 88 89 BA 8B 8C 

发 送 区 设置 SE BF 90 91 92 93 94 95 96 97 98 99 YA 9B 9C 9D YE OF AO Al AZ 

; A4 AS AB AT AB A9 AA AB AC AD AE AF BO Bi B2 B3 B4 BS BG BT B8 

三 启用 文件 数据 源 . BA BB BC BD BE BF CO Ci C2 C3 C4 CS C6 CT C8 C9 CA CB CC CD CE 

厂 自动 发 送 附 如 位 DO Di D2 D3 D4 DS D6 D7 D8 D9 DA DB DC DD DE DF EO El EŻ E3 E4 

厂 发 送 完 自动 清空 ES ET ES E9 EA EB EC ED EE EF FO Fi F2 F3 F4 FS F6 FT FS F9 FA 

tH FC FD FE FF 00 01 02 03 04 05 08 07 08 09 OA OB OC OD OF OF 10 

er 11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1E IF 20 21 22 23 24 25 26 

厂 数据 流 循环 发 27 28 29 2A 2B 2C 2D 2E 2F 30 31 32 33 34 35 36 37 38 39 3A 3B 3C 
发 送 间隔 [1000 =e 


eA 清除 显 区 
\ 
Le 就 绪 ! BIE : 接收 :4723 Bu, 


| 使用 十 六 进 制 显 示 “| 接收 到 的 数据 


图 14-23 ”UART 实 验 的 结果 


14.7 测试 三 一 模拟 操作 系统 的 
加 载 过 


14.7.1 ”测试 内 容 


本 测试 是 一 个 稍微 综合 的 测 Flash 
试 ， 用 来 模拟 操作 系统 的 加 载 过 
程 ， 其 中 需要 编写 两 个 程序 : 
BootLoader 、 SimpleOS。 它们 在 
Flash 中 的 存放 位 置 如 图 14-24 所 示 。 SimpleOS 


eee eee 


BootLoader?# WX TE Flash M 0x0 4h 
开始 的 空间 ，SimpleOS 存 放 在 Flash 
从 0x304 处 开始 的 空间 ， 另 外 ， 在 length 
Flash 的 0x300 处 存放 的 是 SimpleOS 的 


长 度 信息 。 BootLoader 
OpenMIPS 启 动 后 ， 会 首先 执行 0x0 


BootLoader。BootLoader 读 取 人 存放 在 14-24 BootLoader、SimpleOS 两 个 程序 
Flash 的 0x300 处 的 长 度 信 息 length ， ”在 Flash 中 的 存放 位 置 

根据 该 信息 ， 将 Flash 从 0x304 处 开始 

的 length 个 字 ， 依 次 复制 到 SDRAM 从 0x0 处 开始 的 空间 ， 也 就 是 将 
SimpleOS 读 取 到 SDRAM。 读 取 结 束 后 ， 跳 转 到 SDRAM 的 0x0 地 址 ， 
将 控制 权 交 给 SimpleOS， 这 个 过 程 模拟 了 目前 一 些 操作 系统 的 加 载 过 


程 。 


0x304 
0x300 


其 中 的 SimpleOS 是 一 个 很 简单 的 程序 ， 实 现 了 UART 的 回 显 。 当 
PC 通过 UART 发 送 数据 给 小 型 SOPC 时 ， 会 引发 UART 控 制 器 的 中 断 ， 
SimpleOS 中 的 中 断 处 理 程序 会 读 取 传 递 过 来 的 数据 ， 然 后 回 送 给 PC， 
从 而 实现 UART 的 回 显 。 从 描述 中 可 以 发 现 ， 该 程序 还 可 以 验证 实践 
版 OpenMIPS 处 理 器 的 中 断 功 能 是 否 实现 正确 。 


14.7.2 ”测试 程序 BootLoader 


测试 程序 BootLoader 的 代码 如 下 ， 读 者 可 以 在 本 书 光 盘 
Code\Chapter14\bootloader 目 录 下 找到 源 文 件 BootLoader.S， 以 及 编译 
所 需 的 Makefile、ram.ld 等 文件 。 


上 述 程序 可 以 分 为 九段 理解 ， 分 别 如 下 。 


第 一 段 : 初始 化 UART 控 制 器 ， 包 括 设置 分 频 系数 、 数 据 格 式 。 
与 UART 实 验 中 是 一 样 的 ， 读 者 可 以 参考 14.6.2 节 。 


第 二 段 : 初始 化 GPIO 模 块 ， 包 括 使 能 所 有 输出 接口 、 禁 止 输入 中 
断 。 与 GPIO 实 验 中 是 一 样 的 ， 读 者 可 以 参考 14.5.2 节 。 


第 三 段 : SDRAM 在 使 用 之 前 需要 初始 化 ， 此 处 就 是 等 待 SDRAM 
初始 化 完毕 。 在 小 型 SOPC 实 现 的 时 候 将 SDRAM 控 制 器 的 输出 信号 
sdram_init_done 作 为 GPIO 模 块 输入 信号 的 第 16bit， 可 以 参考 13.7 节 ， 
所 以 此 处 读 取 GPIO 的 输入 ， 然 后 判断 第 16bit 是 否 为 1， 如 果 为 1， 表 示 
SDRAM 初 始 化 完毕 ， 否 则 ，SDRAM 没 有 初始 化 完毕 。 初 始 化 完毕 
后 ， 程 序 可 以 往 后 执行 。 


FIR: 通过 UART 显 示 一 些 启动 开始 信息 ， 其 中 
_BootBeginInfoStr、_BootBeginInfo StrLen， 都 是 在 第 九段 中 定义 的 ， 
前 者 是 要 显示 的 启动 开始 信息 ， 是 一 个 字符 串 ， 后 者 是 这 个 字符 串 的 
长 度 。UART 发 送 数 据 是 通过 调用 遂 数 printf 实 现 的 ， 该 遂 数 在 第 八 段 
中 定义 。 注 意 在 这 里 使 用 的 指令 li、la， 这 两 条 指令 都 是 汇编 指令 ， 是 
汇编 器 定义 的 指令 ， 分 别 等 价 于 如 下 机 器 指令 。 


// 1i 指 令 用 来 加 载 立即 数 到 寄存 器 
li $1,0x1 等 价 于 ori $1,$0,0x1 


// la 指令 用 来 将 指定 的 地 址 加 载 到 寄存 器 ， 如 下 ， 其 中 %hi(addr ) 表 示 addr 的 高 
16bit 
// %lo(addr ) 表 示 addr 的 低 16bit 
la $2, BootBeginInfoStr 等 价 于 lui $2, 
%hi(_BootBeginInfoStr) 

addiu $2, $2, 


%lo(_BootBeginInfoStr) 


SAE: 读 取 Flash 地 址 0x300 处 的 字 ， 也 就 是 SimpleOS 的 长 度 信 


第 六 段 : 将 Flash 从 地 址 0x304 开 始 的 SimpleOS 复 制 到 SDRAM。 


第 七 段 : 通过 UART 显 示 一 些 启 动 结束 信息 ， 其 中 
_BootEndInfoStr、 oa 都 是 在 第 九段 中 定义 的 ， 前 者 
是 要 显示 的 启动 结束 信息 ， 是 一 个 字符 串 ， 后 者 是 这 个 字符 串 的 长 


SAR: 串口 输出 函数 ， 要 输出 的 字符 就 是 寄存 器 44 的 最 低 字 

各 其 写 入 UART 控 制 器 的 Transmitting Holding Register， 然 后 等 待 

毕 ， 最 后 返回 。 注 意 ， 因 为 调用 该 水 数 的 时 候 使 用 的 是 jal 指 
令 ， 会 将 返回 地 址 保存 在 寄存 器 $31 中 ， 所 以 可 以 直接 使 用 jr $31 指 令 
返回 。 读 者 如 果 忘 记 了 jal 指 令 的 用 法 ， 请 复习 一 下 8.2 节 。 


第 九段 : 一 些 预定 义 信 息 。 


14.73 ”测试 程序 SimpleOS 


测试 程序 SimpleOS 的 代码 如 下 ， 读 者 可 以 在 本 书 光盘 中 
Code\Chapter1l4\simpleos 目 录 下 找到 源 文件 SimpleOS.S， 以 及 编译 所 需 
的 Makefile、ram.ld 等 文件 。 


.Org 0x0 
.Set noat 
.Set noreorder 


,Set nomacro 


上 述 程序 可 以 分 为 五 段 理 解 ， 分 别 如 下 。 


BR: 跳 转 到 地 址 0x100 处 ， 因 为 SimpleOS 是 在 SDRAM 中 运行 
的 ， 而 SDRAM 挂 接 在 Wishbone 总 线 互联 矩阵 的 从 设备 接口 0， 所 以 


SDRAM 的 起 始 地 址 是 0x0。 又 因为 OpenMIPS 定 义 的 异常 处 理 例 程 入 
口 地 址 为 0x20、0x40 (参考 表 11-2) ， 所 以 尽量 不 要 使 用 低地 址 空 
间 ， 此 处 直接 转移 到 0x100 处 开始 执行 。 


第 二 段 : 在 地 址 0x20 处 ， 定 义 了 中 断 处 理 例 程 。 其 中 获取 CP0 中 
Cause 寄 存 器 的 值 ， 依 据 Cause[11] 的 值 判断 是 否 是 UARIT 中 断 ， 在 第 13 
章 设 计 SOPC 的 时 候 ， 将 UART 控 制 器 的 中 断 输出 uart_int 连 接 到 了 
OpenMIPS 处 理 器 的 中 断 输 入 接口 ， 如 下 。 


assign int = {3'b000, gpio_int, uart_int, timer_int}; 


上 面 中 断 输 入 接口 int 的 值 最 终 会 被 赋 给 Cause 寄 存 器 的 IP[7:2] 字 段 
(参考 10.3 节 协 处 理 器 CP0 的 实现 ) ，IP[3] 就 对 应 uart_int， 人 参考 表 10-6 
可 知 ，IP[3] 是 Cause 寄 存 器 的 第 1lbit， 所 以 此 处 依据 Cause[11] 的 值 判 
断 是 否 是 UART 中 断 。 如 果 是 UARI 中 断 ， 那 么 转移 到 函数 _int2 进 一 步 
处 理 。 


第 三 段 : 是 地 址 0x100 处 的 程序 ， 在 其 中 初始 化 UART 控 制 器 ， 包 
括 设置 分 频 系 数 、 数 据 格式 ， 读 者 应 该 很 熟悉 了 ， 唯 一 增加 的 一 点 是 
1% E Interrupt Enable Register (IER) ， 该 寄存 器 的 地 址 是 
0x10000001， 参 考 表 13-9 可 知 ， 设 置 其 值 为 0x01， 就 是 使 能 UART 控 制 
器 的 数据 接收 中 断 。 


第 四 段 : 初始 化 CP0 中 的 Status 寄 存 器 ， 设 置 其 值 为 0x10000801， 
参考 表 10-5 可 知 ， 即 设置 标志 位 正 为 1、 标 志 位 IM[3] 为 1， 对 于 小 型 
SOPC 而 言 ， 标 志 位 IM[3] 对 应 的 就 是 UART 中 断 ， 所 以 此 处 就 是 使 能 
UART 中 断 。 第 四 段 的 最 后 会 进入 一 个 无 限 循环 ， 等 待 UART 中 断 的 发 
生 。 


FAR: 定义 了 函数 int2， 该 函数 在 第 二 段 的 中 断 处 理 例 程 中 会 
被 调用 。 首 先 获取 UART 控 制 器 的 Line Status 寄 存 器 的 值 ， 判 断 最 低位 
是 否 为 1， 人 参考 表 13-11 可 知 ， 该 位 为 1 表示 接收 FIFO 不 为 空 ， 有 数据 ， 
该 位 为 0 表示 接收 FIFO 为 空 ， 没 有 数据 。 如 果 没 有 数据 ， 那 么 直接 转 
移 到 _end 处 ， 中 断 处 理 结 束 。 如 果 有 数据 ， 那 么 先 读 取 数 据 ， 然 后 将 
该 数据 再 通过 UARIT 发 送出 去 。 接 下 来 等 待 数 据 发 送 完毕 ， 其 过 程 与 
UARIT 实 验 是 一 样 的 。 数 据 发 送 完 毕 后 ， 再 次 判断 是 否 接收 到 数据 ， 
如 果 没 有 数据 ， 那 么 直接 转移 到 _end 处 ， 中 断 处 理 结束 。 如 果 有 数 
据 ， 那 么 再 次 读 取 数据 ， 通 过 UART 发 送出 去 。 如 此 反复 ， 直 到 没有 
接收 数据 为 止 。 


因为 SimpleOS 是 在 SDRAM 中 运行 ， 所 以 其 链接 脚本 ram.1d 与 本 章 
其 余 实 验 不 同 ， 其 中 设置 起 始 地 址 为 0x00000000 ， 而 不 再 是 
0x30000000 ， 主 要 修改 如 下 ， 完 整 文件 可 以 参考 本 书 附带 光盘 中 
Code\Chapterl4\simpleos 目 录 下 的 ram.ld。 


MEMORY 


ram : ORIGIN = 0x00000000, LENGTH = 
0x00001000 


} 


14.7.4 ”将 测试 程序 写 入 Flash 


将 上 两 小 节 介 绍 的 程序 分 别 编译 ， 得 到 两 个 二 进 制 文件 : 
BootLoader.bin、SimpleOS.bin， 然 后 需要 将 这 两 个 文件 按照 图 14-24 所 
示 的 要 求 写 入 Flash， 有 两 种 方法 。 


(1) 分 两 次 分 别 将 BootLoaderbin、 SimpleOS.bin5 AFlash, 5 
入 完成 后 ， 还 要 将 SimpleOS 的 长 度 信 息 写 入 Flash 的 0x300 处 。 所 以 ， 
一 共 需 要 写 三 次 Flash。 


(2) 将 BootLoader.bin、SimpleOS.bin、SimpleOS 的 长 度 信息 按照 
图 14-24 所 示 组 合成 一 个 二 进 制 文件 ， 然 后 写 入 Flash， 这 样 只 需 写 一 


次 。 


此 处 只 介绍 第 (2) 种 方法 ， 在 本 书 附带 光盘 中 Code\Chapter14 目 
录 下 提供 了 一 个 小 程序 BinMerge.exe ， 该 程序 也 是 在 Ubuntu 下 运行 
的 ， 其 作用 就 是 将 BootLoader.bin、SimpleOS.bin、SimpleOS 的 长 度 信 
息 按照 图 14-24 所 示 组 合成 一 个 二 进 制 文件 。 


将 BootLoader.bin、 SimpleOS.bin 复 制 到 BinMerge.exe 同 一 个 目录 
下 ， 然 后 输入 如 下 命令 。 其 中 -{f 后 面 的 参数 是 简单 操作 系统 的 二 进 制 
文件 ， 此 处 就 是 SimpleOS.bin，-o 后 面 的 参数 是 最 终 输 出 的 二 进 制 文件 
名 ， 此 处 命名 为 Image.bin， 读 者 可 以 依据 实际 情况 命名 。 


./BinMerge.exe -f SimpleOS.bin -o Image.bin 


还 可 以 将 上 述 命令 放 在 SimpleOS 对 应 的 Makefile 文 件 中 ， 这 样 在 
编译 SimpleOS 的 时 候 ， 就 直接 得 到 Image.bin。 为 此 ， 修 改 SimpleOS 对 
应 的 Makefile 文 件 如 下 。 完 整 文件 可 以 参考 本 书 附带 光盘 中 
Code\Chapter1l4\simpleos 目 录 下 的 Makefile。 


ifndef CROSS_COMPILE 
CROSS_COMPILE = mips-sde-elf- 
endif 


CC = $(CROSS_COMPILE)as 


得 到 Image.bin 后 ， 需 要 将 其 写 入 Flash， 本 节 不 再 给 出 详细 的 写 入 
步 又， 读者 可 以 参考 GPIO 实 验 。 


14.75 ”测试 效果 


将 Image.bin 写 入 Flash， 然 后 下 载 14.3 节 得 到 的 小 型 SOPC 的 配置 文 
件 到 FPGA， 详 细 步 骤 参 考 GPIO 实 验 。 


打开 串口 程序 ， 将 参数 设置 为 与 小 型 SOPC 的 一 样 ， 即 设置 疲 特 率 
为 9600bps、8 位 数据 位 、 没 有 奇偶 校 验 位 、1 位 停止 位 。 通 过 拨 动 开关 
SW17 复 位 OpenMIPS ， 然 后 启动 OpenMIPS， 串 口 程序 会 得 到 如 图 14- 
25 所 示 的 结果 ， 可 知 ，BootLoader 加 载 操作 系统 成 功 。 然 后 ，PC 通 过 
串口 发 送 任意 字符 ， 都 会 被 小 型 SOPC 回 送 ， 如 图 14-26 所 示 ， 可 知 
SimpleOS 工 作 正 常 。 


串口 的 参数 要 与 小 型 SOPC 设 置 的 一 样 
Sib (Craze V3.1) 


串口 号 COM1 v 

波 特 率 | 9600 y] 

校 验 位 [NONE y] 

oo = BootLoader 加 载 操作 | 
af = ootLoader 

Birk =] 系统 的 信息 。 | 


注意 : 不 使 用 十 六 进 制 显示 


FP 启用 文件 数据 源 ,. . 
厂 自动 发 送 附加 位 
三 发 送 完 自动 清空 
三 按 十 六 进 制 发 送 
M 数据 流 御 环 发 送 


发 送 间隔 |1000 毫秒 
ee 


y Miti DE: Ek Sitt y 


14-25 “BootLoader 加 载 操 作 系 统 成 功 


Loading OS into SDRAM... 
“LLoad OS into SDRAM DONE!!! 
自己 动手 写 CPV, Pawo 


PC 接收 到 的 数据 ， 正 
是 发 送 的 数据 


接收 区 设置 

厂 RREI... 
厂 自动 换行 显示 

厂 十 六 进 制 显示 

厂 暂停 接收 显示 
发 送 区 设置 

厂 启用 文件 数据 源 .. . 
三 自动 发 送 附 加 位 
厂 发 送 完 自动 清空 
厂 控 十 六 进 制 发 送 
厂 数据 流 循环 发 送 
发 送 间隔 [1000 毫秒 


| 自己 动手 写 CPV, RAS 
Te BRIT 


Ler 就 绪 ! Riss : 接收 : 4881 


图 14-26 ”SimpleOS 工 作 正 常 


148 ZE) 


本 章 将 第 13 章 实现 的 小 型 SOPC 下 载 到 开发 平台 DE2， 并 通过 三 
实验 UART 实 验 、 模 拟 操作 系统 加 载 过 程 实验 ， 证 明 
e 践 版 OpenMIPS 处 理 器 设计 正确 ， 并 且 小 型 SOPC 的 各 个 模块 也 都 

运行 正确 。 


第 15 章 将 为 实践 版 OpenMIPS 处 理 器 移植 符 入 式 操 作 系统 hC/OS- 
Ilo 


第 15 章 ”为 OpenMIPS 处 理 器 移植 
nC/OS-II 


截止 到 本 章 ， 我 们 已 经 实现 了 实践 版 OpenMIPS 处 理 器 ， 并 且 以 
OpenMIPS 为 核心 ， 实 现 了 一 个 小 型 SOPC， 包 括 : GPIO、UARTIT 控 制 
器 、Flash 控 制 器 、SDRAM 控 制 器 。 应 该 可 以 说 ， 一 个 属于 用 户 自己 
的 小 型 计算 机 诞生 了 。 在 第 14 章 我 们 还 编写 程序 运行 在 这 个 小 型 计算 
机 上 ， 实 现 了 输入 /输出 、 串 口 发 送 数据 等 功能 ， 但 似乎 还 缺少 什么 ， 
是 的 ， 缺 少 一 个 操作 系统 ， 作 为 一 个 完整 的 小 型 计算 机 ， 怎 么 能 够 没 
有 属于 自己 的 操作 系统 呢 ? 现在 就 为 OpenMIPS 处 理 器 打造 属于 自己 的 
操作 系统 。 


本 章 的 目的 是 移植 开源 实时 操作 系统 hC/OS-I 到 OpenMIPS， 首 先 
讨论 了 为 什么 需要 操作 系统 、 什 么 是 实时 操作 系统 ， 然 后 介绍 了 开源 
实时 操作 系统 hC/OS-II[， 主 要 从 其 特点 、 重 要 概念 、 基 本 功能 、 文 件 
体系 、 移 植 条 件 等 几 个 方面 讲解 。 接 着 详细 给 出 了 移植 hC/OS-II 到 
OpenMIPS 的 步 又 ， 最 后 ， 通 过 DE2 开 发 平台 验证 移植 后 的 JC/OS-II 工 
作 正 确 ， 从 而 证 明 移 植 成 功 。 


15.1 为 什么 需要 操作 系统 


邹 恒 明 在 《计算 机 的 心智 : 操作 系统 之 哲学 原理 》 一 书 中 有 如 下 
Mo 


人 有 心智 吗 ? 我 想 所 有 人 都 会 回答 : 有 ! 人 的 心智 融 是 人 的 灵 
气 。 这 是 每 一 个 人 的 生命 之 气 。 就 是 这 个 灵气 赋予 了 人 丰富 的 思 
维 、 感 受 和 行动 能 力 。 


那么 计算 机 有 心智 吗 ? 这 不 是 一 个 诡秘 或 者 搞笑 的 问题 。 


人 们 通常 认为 能 够 运动 的 生命 都 是 有 灵气 的 ， 既 然 计算 机 能 够 


完成 一 些 人 脑 才能 够 完成 的 理性 任务 ， 它 当然 也 有 心智 ! 而 这 个 心 
智 就 是 操作 系统 。 因 为 操作 系统 周 予 了 计算 机 以 活力 。 


操作 系统 作为 计算 机 赖 以 运转 的 控制 中 心 ， 称 其 为 计算 机 的 心 
智 可 谓 恰如其分 。 


处 理 器 、 存 储 器 、IO 等 硬件 设备 组 成 计算 机 的 躯壳 ， 操 作 系统 构 
成 计算 机 的 心智 ， 没 有 心智 的 计算 机 犹如 人 之 没有 魂 灵 ， 这 个 比喻 有 
点 诗意 了 ， 但 是 也 印证 了 操作 系统 的 重要 性 。 


操作 系统 是 介 于 计算 机 和 应 用 软件 之 间 的 一 个 软件 系统 ， 用 于 党 
控 计 算 机 上 的 所 有 事情 ， 其 下 是 硬件 平台 ， 其 上 是 应 用 软件 。 如 图 15- 
1 所 示 。 


应 用 软件 
虚拟 机 器 界面 


操作 系统 
物理 机 器 界面 


硬件 


图 15-1 操作 系统 上 下 界面 


还 是 借用 邹 恒 明 在 《计算 机 的 心智 : 操作 系统 之 哲学 原理 》 一 书 
中 的 观点 ， 其 认为 操作 系统 扮演 两 个 根本 角色 : 魔幻 家 和 管理 者 。 


1. 魔幻 家 角色 


操作 系统 将 计算 机 以 一 种 更 加 容易 、 更 加 方便 、 更 加 强大 的 方式 
呈现 给 用 户 使 用 。 直 和 白 的 说 ， 就 是 把 差 的 东西 变 好 ， 把 少 的 东西 变 
多 ， 把 复杂 的 东西 变 得 容易 。 例 如 ， 如 果 在 裸 机 上 直接 编程 是 很 困难 
的 ， 因 为 各 种 数据 转移 均 需 要 用 户 自 己 来 控制 ， 对 不 同 设备 要 用 不 同 
的 命令 来 驱动 ， 而 这 对 一 般 人 来 说 很 难 胜任 。 操 作 系统 将 这 些 工作 从 
用 户 手中 接 过 来 ， 从 而 让 用 户 感 觉 到 编程 是 一 件 容易 的 事 。 


2. 管理 者 角色 


操作 系统 管理 计算 机 上 的 软 硬 件 资源 ， 具 体 包 括 CPU、 内 存 、 外 
存 、1/O 等 。 操 作 系 统 使 得 不 同 用 户 之 间或 者 同一 用 户 运行 的 不 同 程 序 
之 间 可 以 安全 有 序 的 共享 这 些 硬 件 资源 。 管 理 的 关键 原则 是 有 效 和 公 
平 ， 有 效 指 的 是 不 能 浪费 资源 ， 公 平 指 的 是 每 个 人 都 有 享有 资源 的 可 


4b 
Abo 


正 是 因为 操作 系统 扮演 的 这 两 个 角色 ， 可 以 让 应 用 程序 脱离 硬 
件 ， 提 高 应 用 程序 的 可 移植 性 和 可 读 性 ， 另 外 ， 当 要 实现 的 应 用 比较 
复杂 时 ， 操 作 系统 可 以 为 这 个 复杂 的 应 用 提供 管理 机 制 ， 程 序 员 只 要 
完成 功能 阔 数 ， 并 且 添 加 任务 即 可 ， 不 用 再 去 处 理 不 同 任务 之 间 的 通 
信 以 及 各 个 不 同 功 能 之 间 如 何 协同 工作 等 问题 ， 所 以 我 们 需要 操作 系 


统 。 


15.2 RAIN FRE 


既然 操作 系统 如 此 重要 ， 那 我 们 就 给 OpenMIPS 安 装 Windows 好 


当然 不 行 。 首 先 ， 操 作 系 统 要 能 够 在 新 的 处 理 器 上 运行 ， 是 需要 
修改 部 分 代码 的 ， 而 Windows 没 有 公开 源 代码 ， 无 法 修改 。 其 次 ， 
Windows 太 庞大 了 ， 而 我 们 DE2 上 的 Flash 只 有 4MB、SDRAM 只 有 
8MB， 所 以 不 能 运行 Windows。 实 际 上 ,一般 在 SOPC 上 运行 的 都 是 一 
E6 \\T5 BY Be A xt Se BY $2 fF A (Embedded Real-time Operation 
System) 。 从 名 称 上 可 以 发 现 是 同 入 式 操作 系统 、 实 时 操作 系统 的 交 
集 。 所 以 下 面 分 别 介 绍 这 两 种 操作 系统 。 


1.， 铸 入 式 操作 系统 


在 解释 什么 是 能 入 式 操作 系统 之 前 ， 需 要 先 解 释 什 么 是 能 入 式 系 
统 。 目 前 ， 我 国 普 遍 认 同 的 能 入 式 系统 定义 为 : 以 应 用 为 中 心 ， 以 计 
算 机 技术 为 基础 ， 软 硬件 可 裁剪 ， 适 应 应 用 系统 对 功能 、 可 靠 性 、 成 
本 、 体 积 、 功 耗 等 严格 要 求 的 专用 计算 机 系统 。 


与 个 人 计算 机 这 样 的 通用 计算 机 系统 不 同 ， 赂 入 式 系 统 通常 执行 
的 是 带 有 特定 要 求 的 、 预 先 定 义 的 任务 。 由 于 府 入 式 系统 只 针对 一 些 
特定 任务 ， 所 以 设计 人 员 能 够 对 它 进行 优化 ， 减 小 尺寸 ， 降 低 成 本 。 


He A RIRA (EOS: Embedded Operating System) 就 是 用 于 
BRA TULA ZAIRE Zo 


2. 实时 操作 系统 


实时 操作 系统 (RTOS: Real Time Operating System) 是 指 当 外 界 
事件 或 数据 产生 时 ， 能 够 接收 并 以 足够 快 的 速度 予以 处 理 ， 其 处 理 的 
结果 又 能 在 规定 的 时 间 之 内 来 控制 生产 过 程 、 做 出 快速 响应 ， 并 控制 
所 有 实时 任务 协调 一 致 运行 的 操作 系统 。 因 而 ， 提 供 及 时 响应 和 高 可 
靠 性 是 其 主要 特点 。 实 时 操作 系统 有 硬 实 时 和 软 实时 之 分 ， 硬 实时 要 
求 在 规定 的 时 间 内 必须 完成 操作 ， 这 是 在 操作 系统 设计 时 保证 的 ; A 
实时 则 只 要 按照 任务 的 优先 级 ， 尽 可 能 快 地 完成 操作 即 可 。 


RTOS 的 内 核 一 般 采 用 可 剥夺 型 内 核 (Preemptive Kernel) ， 在 这 
种 内 核 中 ， 当 有 更 高 优先 级 的 任务 就 绪 时 ， 总 能 得 到 CPU 的 控制 权 。 
所 以 ， 在 可 剥夺 型 内 核 中 ， 最 高 优先 级 的 任务 何 时 可 以 执行 、 何 时 可 
以 得 到 CPU 的 控制 权 ， 是 可 知 的 。 


目前 ， 常 用 的 罕 入 式 实 时 操作 系统 有 HC/OS-II、RTEMS、 
VxWorks、eCos、FreeRTOS、RITLinux、 工 Kernel 等 ， 国 内 目前 也 有 很 
多 ， 比 如 Raw OS、RT-Thread 等 。 本 章 计划 为 OpenMIPS 处 理 器 移植 
hC/OS-I， 所 以 下 面 仅 对 hC/OS-I 进 行 详细 介绍 。 


15.3 pC/OS-II 简 介 


HC/OS-II 读 作 “micro C O S 2”， 意 为 “ 微 控 制 器 操作 系统 版 本 2”， 
是 一 个 完整 的 、 可 移植 、 可 裁剪 、 开 源 的 、 可 剥夺 型 实时 操作 系统 ， 
hC/OS-I 在 世界 范围 内 得 到 广泛 使 用 ， 包 括 诸多 领域 ， 如 手机 、 路 由 
器 、 人 集线器、 不 间断 电源 、 飞行 器 、 医 疗 设备 及 工业 控制 等 ， 并 且 得 


了 美国 eos 理 局 的 认证 ， 这 充分 证 明了 pC/OS-II 的 高 度 稳定 可 
， 能 够 用 于 安全 性 条 件 极 为 苛刻 的 系统 。 


Je 


HC/OS-II 采 用 ANSI 的 C 语 言 编写 ， 包 含 一 小 部 分 汇编 语言 代码 ， 
使 之 可 以 在 不 同 架 构 的 微 处 理 器 上 使 用 。 至 今 ， 从 8 位 到 32 位 ， 
HC/OS-II 已 经 在 超过 40 种 不 同 架构 的 微 处 理 器 上 运行 。 


uC/OS-I 的 作者 Jean J. Labrosse 出 版 了 介绍 phC/OS-II 的 书 
«MicroC/OS-II The Real Time Kernel) ， 该 书 至 今 已 出 了 第 2 版 ， 是 学 
习 kC/OS-II 的 必 备 书籍 ， 其 中 文 版 由 邵 贝 贝 翻 译 ， 书 名 为 《嵌入 式 实 
时 操作 系统 hC/OS-II (第 2 版 )》， 读 者 朋友 可 以 参考 。 


15.4 nC/OS-II 特 点 


HC/OS-I[I 具 有 以 下 特点 。 
1. 提供 源 代码 


5 Linux 一样 ，hC/OS-I 的 源 代 码 也 是 开放 的 ， 用 户 可 以 在 
http://micrium.conmy 网 站 下 载 所 有 源 代 码 。 另 外 ，《 髓 入 式 实时 操作 系 
统 hC/OS-I (第 2 版 ”》 一 书 的 附带 光盘 中 也 有 phC/OS-IT V2.52 版 本 的 
所 有 产 代 码 。 该 产 代 码 清晰 易 懂 ， 且 结构 合理 ，Jean J.Labrosse 也 提供 
了 详尽 的 注解 。 


2。 可 移植 (PortabIe) 


hC/OS-I 源 代码 的 绝 大 部 分 是 使 用 移植 性 很 强 的 ANSI C 编 写 的 ， 
只 有 与 微 处 理 器 硬件 相关 的 部 分 是 使 用 汇编 语言 编写 的 。 汇 编 语言 编 


写 的 部 分 已 经 压缩 到 最 低 限 度 ， 以 使 hC/OS-I 便 于 移植 到 其 他 微 处 理 
器 上 。 


3. 可 固化 (ROMable) 


hC/OS-I 是 为 能 入 式 应 用 而 设计 的 操作 系统 ， 只 要 具备 合适 的 软 
硬件 工具 ， 就 可 将 HC/OS-II 髓 入 到 产品 中 ， 成 为 产品 的 一 部 分 。 


4。 可 裁剪 (Scalable) 


可 根据 应 用 的 需要 来 裁剪 系统 功能 。 可 以 只 使 用 nC/OS-II 中 应 用 
程序 需要 的 系统 服务 ， 也 可 以 使 用 hC/OS-I 的 所 有 功能 ， 从 而 灵活 控 
制 hC/OS-I 占 用 的 存储 器 空间 。 包 含 全 部 功能 的 核心 部 分 代码 占用 
8.3KB， 经 过 裁 勇 ， 最 少 仅 为 2.7KB。 


5。 可 剥夺 型 (Preemptive) 


HC/OS-II 是 完全 可 剥夺 型 的 实时 内 核 ， 总 是 运行 优先 级 最 高 的 就 
绪 任 务 。 


6. 多 任务 


uC/OS-II V2.52 版 本 可 管理 64 个 任务 ,一般 情 况 下 ， 建 议 保留 8 个 
任务 给 hC/OS-I， 这 样 ， 留 给 用 户 应 用 程序 的 任务 最 多 可 有 56 个 。 系 
统 赋予 每 个 任务 的 优先 级 必须 是 不 同 的 ， 这 意味 着 hC/OS-II 不 支持 时 
间 片 轮转 调度 法 (Round-robin Scheduling) o 


最 新 的 hC/OS-II V2.91 版 本 可 以 管理 多 达 250 个 任务 。 


7. 可 确定 性 


hC/OS-I 中 的 绝 大 多 数 函 数 调 用 和 服务 的 执行 时 间 具 有 确定 性 ， 
也 就 是 说 ， 用 户 总 是 能 知道 HHC/OS-I 的 函数 调用 与 服务 执行 了 多 长 时 
间 。 


8. 任务 栈 


每 个 任务 都 有 自己 单独 的 栈 ，hC/OS-I 人 允许 每 个 任务 有 不 同 的 栈 
空间 ， 以 便 满足 应 用 程序 对 RAM 的 需求 ， 使 用 hC/OS-I 的 栈 空间 校 验 
函数 可 确定 每 个 任务 到 底 需 要 多 少 栈 空间 。 


9。 系 统 服务 


hC/OS-I 提 供 很 多 系统 服务 ， 例 如 : 信号 量 、 事 件 标 志 、 消 息 邮 
箱 、 消 息 队 列 、 块 大 小 固定 的 内 存 申 请 与 释放 、 时 间 管 理 函 数 等 。 


10. 中 断 管理 


中 断 可 使 正在 执行 的 任务 暂时 挂 起 ， 如 果 优 先 级 更 高 的 任务 被 中 
断 唤 醒 ， 那 么 高 优先 级 的 任务 会 在 中 断 能 套 全 部 退出 后 立即 执行 ， 中 
断 蔚 套 层 数 最 多 可 达 255 层 。 


1. 稳定 性 与 可 靠 性 


hC/OS-I 是 基于 hC/OS 的 ，hC/OS 自 1992 年 发 布 后 ， 已 有 数 百 个 商 
业 应 用 。hC/OS-I 与 hC/OS 的 内 核 是 一 样 的 ， 只 是 提供 了 更 多 的 功能 。 
另外 ，2000 年 7 月 ，hC/OS-I 在 一 个 航空 项 目 中 得 到 了 美国 联邦 航空 管 
理 局 (FAA: Federal Aviation Administration) 对 用 于 商用 飞机 的 、 符 
合 RTCA DO-178B 标 准 的 认证 ， 该 标准 对 用 于 航空 设备 方面 的 软件 提 
出 了 要 求 。 为 了 符合 这 一 标准 ， 必 须 尽 可 能 地 通过 文件 描述 和 测试 ， 
展示 软件 在 稳定 性 与 安全 性 这 两 方面 都 符合 要 求 。 这 一 结论 对 于 操作 


系统 来 说 特别 重要 ， 因 为 这 一 结论 表明 ， 该 操作 系统 的 质量 得 到 了 认 
证 ， 可 以 在 任何 应 用 中 使 用 。hC/OS-I 的 每 一 种 功能 、 每 一 个 孙 数 及 
每 一 行 代 码 都 经 过 了 考验 与 测试 。 在 2011 年 发 射 到 火星 的 “好 奇 号 ” 火 
星 探测 车 上 就 有 一 个 分 析 实 验 室 由 hC/OS-II 控 制 。 


15.5 ”pC/OS-II 的 几 个 概念 


155.1 ES 


任务 ， 也 称 为 线程 ， 是 一 个 简单 的 程序 。hC/OS-I 是 一 个 多 任务 
的 操作 系统 。 典 型 的 是 ， 每 个 任务 都 是 一 个 无 限 循 环 ， 都 可 能 处 在 以 
下 五 种 状态 之 一 一 一 休眠 态 、 就 绪 态 、 运 行 态 、 挂 起 态 、 中 断 态 。 


e WIRES (Dormant) : 相当 于 任务 驻 留 在 内 存 中 ， 但 并 不 被 
内 核 所 调度 。 

MARS (Ready) : 意味 着 任务 已 经 准备 好 ， 可 以 运行 ， 但 
由 于 该 任务 的 优先 级 比 正在 运行 的 任务 的 优先 级 低 ， 所 以 暂 
时 不 能 运行 。 任 务 一 旦 创建 ， 就 处 于 就 绪 态 ， 准 备 运行 。 
运行 态 (Running) : 是 指 任务 掌握 了 CPU 的 使 用 权 ， 正 在 运 
行 中 。 处 于 就 绪 态 的 最 高 优先 级 的 任务 能 够 获得 CPU 的 使 用 
权 ， 从 而 处 于 运行 态 。 

挂 起 态 (Pending) : 也 可 称 为 等 待 事件 态 ， 是 指 任务 在 等 待 
某 一 事件 的 发 生 (例如 : 等 待 某 外 设 的 IO 操作 ， 等 待 某 共 享 
资源 由 不 能 使 用 变 成 能 使 用 ， 等 待定 时 脉冲 的 到 来 ， 等 
=) 。 此 时 ， 任 务 将 被 放 在 该 事件 的 等 待 列 表 中 。 


。 中 断 态 (Interrupt) : 正在 运行 的 任务 可 以 被 中 断 ， 除 非 该 任 
务 将 中 断 天 闭 。 任 务 家 中 断后 ，CPU 将 进入 中 断 服 务 例 程 ， 
被 中 断 的 任务 进入 中 断 态 。 


uC/OS-II V2.91 版 本 最 多 可 管理 250 个 任务 ， 这 些 任务 通常 都 是 一 
个 无 限 循环 的 函数 。 系 统 初始 化 时 会 自动 创建 两 个 任务 : 一 个 是 空 内 
任务 ， 其 优先 级 最 低 ， 只 是 不 停 地 给 一 个 32 位 的 整 型 变量 加 1; 另 一 个 
是 统计 任务 ， 该 任务 每 秒 运 行 一 次 ， 负 责 采 集 当 前 CPU 的 利用 率 


每 个 任务 对 应 一 个 任务 控制 块 OS_TCB ， 任 务 控制 块 就 是 一 个 数 
据 结构 ， 当 任务 的 CPU 使 用 权 被 剥夺 时 ， 需 要 使 用 它 来 保存 该 任务 的 
状态 。 其 定义 如 下 ， 读 者 不 需要 明白 所 有 的 内 容 ， 只 需要 知道 任务 控 
制 块 的 第 一 个 字 中 存储 的 是 该 任务 的 堆栈 栈 顶 指针 ， 在 15.11.3 节 修改 
os_cpu_a.S 文 件 时 ， 需 要 有 这 个 知识 。 


typedef struct os_tcb { 


0S_STK *OSTCBStkPtr; /* AZIJA */ 


#if OS_TASK_CREATE_EXT_EN > Ou 


void *OSTCBExtPtr; 
OS_STK *OSTCBStkBottom; 
INT32U OSTCBStkSize; 


INT16U OSTCBOpt ; 


#endif 


} OS_TCB; 


1552 ”任务 调度 


调度 (Dispatch) 是 内 核 的 主要 职责 之 一 ， 就 是 决定 该 轮 到 哪个 
任务 运行 了 。 多 数 实时 内 核 是 基于 优先 级 调度 法 的 。 每 个 任务 根据 其 
重要 程度 的 不 同 ， 被 赋予 一 定 的 优先 级 。 基 于 优先 级 调度 法 是 指 ， 
CPU 总 是 让 处 于 就 绪 态 的 、 优 先 级 最 高 的 任务 运行 。 


hC/OS-I 是 可 剥夺 型 实时 多 任务 内 核 。 可 剥夺 型 实时 内 核 在 任何 
时 候 都 运行 就 绪 了 的 最 高 优先 级 的 任务 。hC/OS-II 的 任务 调度 是 完全 
基于 任务 优先 级 的 抢占 式 调 度 ， 也 就 是 最 高 优先 级 的 任务 一 旦 处 于 就 
绪 状态 ， 就 立即 抢占 正在 运行 的 低 优先 级 任务 的 CPU 资源 。 为 了 简化 
系统 设计 ，hC/OS-I 规 定 所 有 任务 的 优先 级 不 同 ， 因 而 任务 的 优先 级 
也 同时 唯一 标识 了 该 任务 本 身 。 


15.5.3 ”任务 切换 


任务 切换 (Context Switch) ， 有 时 也 被 称 为 上 下 文 切 换 。 当 多 任 
务 内 核 决定 运行 男 一 个 任务 时 ， 它 首先 保存 正在 运行 的 任务 的 状态 
(Context) ， 即 CPU 全 部 寄存 器 的 内 容 。 这 些 内 容 保 存在 任务 的 堆栈 
中 ， 然 后 把 下 一 个 将 要 运行 的 任务 的 状态 从 该 任务 的 堆栈 中 重新 装 入 
CPU 的 寄存 器 ， 开 始 下 一 个 任务 的 运行 ， 这 一 过 程 叫做 任务 切换 。 


15.5.4 nC/OS-II 的 中 断 处 理 


中 断 发 生 后 ， 一 般 会 进入 中 断 服 务 子 程序 ，hC/OS-I 的 中 断 服务 
子 程序 要 用 汇编 语言 来 编写 ， 其 结构 如 下 。 


保存 CPU 的 全 部 寄存 器 

调用 函数 0SIntEnter 或 者 直接 将 变量 0SIntNesting 加 1 
清除 中 断 源 

重新 开 中 断 

执行 用 户 代码 做 中 断 处 理 

调用 函数 0SIntEXIt 

恢复 CPU 的 全 部 寄存 器 

执行 中 断 返 回 指 令 


中 断 可 使 正在 执行 的 任务 暂时 挂 起 ， 所 以 ， 进 入 中 断 服 务 子 程序 
后 ， 首 先 应 将 CPU 的 全 部 寄存 器 保存 到 被 中 断 的 任务 的 堆栈 中 。 
hC/OS-I 需 要 知道 正在 做 中 断 服 务 ， 所 以 要 调用 国 数 OSIntEnter 或 者 直 
接 将 全 局 变量 OSIntNesting 加 1。 这 样 ， 只 要 变量 OSIntNesting 不 为 0， 
就 表示 处 于 中 断 处 理 过 程 中 。 然 后 ， 可 以 选择 是 否 允 许 新 的 中 断 ， 如 
果 人 允许 ， 那 么 必须 清除 中 断 源 ， 重 新 开 中 断 。 


现在 可 以 正式 开始 处 理 中 断 了 。 中 断 处 理 结束 后 ， 需 要 调用 函数 
OSIntExit ， 用 于 将 全 局 变量 OSIntNesting 减 1， 当 OSIntNesting 等 于 0 
时 ， 就 表示 所 有 中 断 ， 包 括 主 套 的 中 断 都 已 经 处 理 完 毕 。 此 时 ， 
HC/OS-II 必 须 判 断 是 否 有 优先 级 更 高 的 任务 被 中 断 服务 子 程序 唤醒 ， 
如 果 有 ， 就 返回 到 更 高 优先 级 的 任务 ， 反 之 ， 返 回 到 被 中 断 的 任务 。 
将 要 运行 的 任务 的 寄存 器 从 堆栈 恢复 。 最 后 ， 执 行 中 断 返回 指令 。 


15.5.5 ”时钟 节拍 


时 钟 节拍 (Clock Tick) 是 特定 的 周期 性 中 断 ， 这 个 中 断 可 以 认为 
是 系统 心脏 的 脉动 。 时 钟 的 节拍 式 中 断 使 得 内 核 可 以 将 任务 延 时 若干 
个 整数 时 钟 节拍 ， 以 及 当 任 务 等 待 事件 发 生 时 ， 提 供 等 待 超时 的 依 
据 。 时 钟 节拍 源 可 以 是 专门 的 硬件 定时 器 ， 也 可 以 是 来 自 50/60Hz 交 流 
电源 的 信号 。hC/OS-I 的 节拍 率 应 为 每 秒 10-100 次 ， 或 者 说 10- 
100Hz。 时 钟 节拍 率 越 高 ， 系 统 的 额外 负荷 就 越 重 。 时 钟 节拍 的 实际 
频率 取决 于 用 户 应 用 程序 的 精度 要 求 。 


HC/OS-II 的 启动 过 程 中 ， 一 般 先 调用 系统 初始 化 遂 数 OSInit， 再 调 
用 系统 启动 函数 OSStart。 在 调用 OSStart 之 后 做 的 第 一 件 事 就 是 允许 时 
钟 节 拍 中 断 ， 容 易 犯 的 错误 是 ， 将 允许 时 钟 节 拍 中 断 放 在 函数 OSInit 
Zils, MÉXOSStartZ Alo 


void main(void) 
OSInit(); /* 初始 化 uC/0S-II */ 


/* 应 用 程序 初始 化 代码 */ 
/* 通过 调用 函数 0STaskCreate 创 建 至 少 一 个 任务 */ 


允许 时 钟 节拍 中 断 /* 


iz! ! 不 可 aap 

2 

0SStart(); /* 系统 启动 */ 
} 


15.5.6 ”nC/OS-II 的 初始 化 


HC/OS-II 在 调用 其 他 任何 服务 之 前 ， 首 先 要 对 系统 初始 化 ， 这 是 
通过 调用 系统 初始 化 函数 OSInit 实 现 的 ， 该 函数 会 初始 化 hC/OS-I 的 所 
变量 和 数据 结构 ， 并 建立 空 内 任务 OS_TaskIdle， 该 任务 总 是 处 于 就 
绪 态 ， 优 先 级 也 总 是 设 成 最 低 ， 即 0S_ LOWEST_PRIO。 如 果 人 允许 建 
立 统 计 任 务 ， 那 么 函数 OSInit 还 会 建立 统计 任务 OS_TaskStat， 也 进入 
就 绪 态 ， 优 先 级 是 次 低 的 ， 即 OS_LOWEST_PRIO-1。 


15.5.7 nC/OS-II 的 启动 


hC/OS-II 启 动 前 ， 至 少 需要 创建 一 个 用 户 任 务 。hC/OS-I 的 启动 是 
通过 调用 函数 OSStart 实 现 的 。OSStart 从 任务 就 绪 表 中 找 出 用 户 建 立 的 
优先 级 最 高 的 任务 的 任务 控制 块 TCB。 然 后 调用 高 优先 级 就 绪 任务 启 
动 图 数 OSStartHighRdy， 该 图 数位 于 文件 os_cpu_a.S 中 。 实 质 上 ， 函 数 
OSStartHighRdy 的 作用 是 将 任务 堆栈 中 保存 的 值 恢复 到 对 应 的 CPU 寄 
存 器 ， 然 后 执行 一 条 中 断 返 回 指令 ， 就 开始 运行 用 户 建 立 的 优先 级 最 
高 的 任务 ， 在 15.11.3 节 会 列 出 该 函数 的 代码 。 


15.6 nC/OS-II 的 基本 功能 


hC/OS-I 实 际 上 是 一 个 实时 操作 系统 内 核 ， 只 包含 了 任务 调度 、 
任务 间 的 通信 与 同步 、 任 务 管理 、 时 间 管 理 、 内 存 管 理 等 基本 功能 ， 
没有 提供 输入 /输出 管理 、 文 件 系统 及 网 络 等 额外 功能 。 其 中 任务 调度 
在 15.5.2 节 已 介绍 ， 所 以 下 面 简单 介绍 hC/OS-I 的 其 余 四 项 基本 功能 。 


15.6.1 ”任务 间 的 通信 与 同步 


对 于 一 个 多 任务 操作 系统 而 言 ， 任 务 间 的 通信 与 同步 是 必 不 可 少 
的 。 任 务 间 的 同步 是 指 ， 异 步 环境 下 的 一 组 并 发 执行 任务 因 各 自 的 执 
行 结果 互 为 对 方 的 执行 条 件 ， 因 而 ， 任 务 之 间 需 互 发 信号 ， 以 使 各 任 
务 按 一 定 的 速度 执行 。hC/OS-I 中 ， 任 务 或 中 断 服务 子 程序 可 通过 事 
件 控制 块 ECB (Event Control Block) 向 另外 的 任务 发 信号 ， 此 处 的 信 
3 (Signal) 也 就 是 事件 (Event) ， 可 以 是 信号 量 、 邮 箱 、 消 息 队 列 
Fo 


156.2 ”任务 管理 


任务 管理 包括 建立 任务 、 删 除 任务 、 改 变 任务 的 优先 级 、 挂 起 和 
恢复 任务 等 功能 ， 通 过 一 系列 阔 数 实现 。 任 务 管理 的 主要 函数 如 下 。 


1. OSTaskCreate 或 OSTaskCreateExt， 用 于 建立 一 个 任务 


2. OSTaskStkChk， 用 于 检验 堆栈 。 堆 栈 是 由 连续 的 内 存 空间 组 
成 的 ， 每 个 任务 都 有 自己 的 堆栈 。 本 函数 用 来 检验 堆栈 空间 的 大 小 。 


3. OSTaskDel， 用 于 删除 一 个 任务 。 其 功能 是 将 任务 返回 并 使 之 
处 于 休眠 状态 ， 这 样 系统 将 不 再 调度 该 任务 


4. OSTaskDelReq， 用 于 请 求 删除 一 个 任务 


5. OSTaskChangePrio， 用 于 改变 任务 的 优先 级 。 任 务 建立 时 ， 系 
统 为 任务 分 配 了 一 个 优先 级 ， 之 后 ， 可 通过 调用 本 函数 来 动态 改变 任 
务 的 优先 级 。 


6. OSTaskSuspend， 用 于 挂 起 任务 
7. OSTaskResume， 用 于 恢复 被 挂 起 的 任务 


8. OSTaskQuery， 用 于 获得 自身 或 其 他 任务 的 信息 。 


15.6.3 MEER 


hC/OS-I 利 用 时 钟 节拍 产生 的 周期 性 中 断 ， 实 现 延 时 和 超时 控制 
等 功能 。 时 间 管 理 是 通过 一 系列 与 时 间 有 关 的 函数 实现 的 。 


1. OSTimeDly， 任 务 延 时 疯 数 ， 该 水 数 会 使 JC/OS-II 进 行 一 次 任 
务 调度 ， 并 且 执 行 下 一 个 优先 级 最 高 的 就 绪 仿 任务 。 任 务 调用 该 水 数 
后 ， 一 旦 规定 的 时 间 期 满 或 者 有 其 他 任务 通过 调用 函数 
OSTimeDlyResume 取消 了 延 时 ， 它 就 会 立即 进入 就 绪 态 。 


2. OSTimeDlyHMSM， 按 时 、 分 、 秒 、 毫 秒 延 时 的 函数 。 与 函数 
OSTimeDly 不 同 之 处 在 于 ， 后 者 的 延 时 单位 是 时 钟 节拍 ， 而 前 者 是 按 
时 、 分 、 秒 、 毫 秒 来 定义 延 时 时 间 。 其 余 功 能 是 一 样 的 。 


3. OSTimeDlyResume, (RE HERS FES AYER EX. iW AA AK 
数 ， 可 使 指定 任务 不 必 等 待 延 时 期 满 ， 就 可 以 处 于 就 绪 态 。 


4. OSTimeGet， 时 钟 节拍 发 生 时 ， 会 将 一 个 计数 器 的 值 加 1， 本 
函数 用 来 获得 当前 计数 器 的 值 。 


5.OSTimeSet， 本 函数 用 来 设置 计数 器 的 值 。 


15.6.4 AGER 


ANSI C 中 ,一 般 使 用 malloc 和 free 两 个 水 数 动态 地 分 配 和 释放 内 
存 。 这 样 ， 随 着 内 存 空间 的 不 断 分 配 和 释放 ， 就 会 把 原来 很 大 的 一 块 
连续 内 存 区 域 逐 淘 地 分 割 成 许多 非常 小 的 但 彼此 之 间 又 不 相 邻 的 内 存 
块 ， 也 就 是 产生 内 存 人 碎片 问题 。 由 于 系统 中 大 量 内 存 碎片 的 存在 ， 使 
得 再 有 程序 要 求 为 之 分 配 内 存 时 ， 可 能 出 现 总 的 内 存 空间 容量 比 所 要 
求 的 大 ， 但 彼此 不 连续 ， 也 就 是 都 以 碎片 的 形式 存在 ， 导 致 内 存 分 配 


GIA E N. MA, FACER ALARA, malloc#lfreekki xe 
HITET ARE) TERRA SUSAR FAA SES OA. 


为 了 解决 多 次 动态 分 配 与 释放 内 存 所 引起 的 内 存 碎 片 以 及 分 配 、 
释放 函数 执行 时 间 不 确定 的 问题 ，hC/OS-II 把 连续 的 大 块 内 存 按 分 区 
来 管理 。 每 个 分 区 都 包含 整数 个 大 小 相同 的 内 存 块 ， 但 不 同 分 区 之 间 
内 存 块 的 大 小 可 以 不 同 。 需 要 动态 分 配 内 存 时 ， 可 选择 一 个 适当 的 分 
区 ， 按 块 来 分 配 内 存 ; 释放 内 存 时 ， 将 该 块 放 回 它 以 前 所 属 的 分 区 。 
这 样 ， 就 能 有 效 解 决 内 存 碎片 问题 。 而 且 ， 每 次 调用 水 数 malloc 和 free 
进行 分 配 和 释放 的 都 是 整数 倍 的 固定 内 存 块 长 ， 这 样 执行 时 间 就 是 确 
定 的 了 。 


hC/OS-I 中 使 用 内 存 控制 块 (Memory Control Blocks) 的 数据 结构 
跟踪 每 一 个 内 存 分 区 ， 每 个 分 区 都 有 属于 自己 的 内 存 控制 块 。 内 存 管 
理 的 主要 函数 如 下 。 


1. OSMemCreate， 用 于 建立 一 个 内 存 分 区 。 


2. OSMemGet， 用 于 分 配 一 个 内 存 块 。 当 某 一 任务 被 调度 执行 
时 ， 必 须 先 从 已 建立 的 内 存 分 区 中 为 该 任务 申请 一 个 内 存 块 。 


3. OSMemPut, EM-TAFR IR ESPERA PAE 
块 时 ， 必 须 及 时 地 把 它 放 回 到 相应 的 内 存 分 区 中 ， 以 便 下 一 次 的 分 配 
操作 。 


4. OSMemQuery， 用 于 查询 一 个 特定 内 存 分 区 的 状态 ， 如 : 查询 
内 存 分 区 中 内 存 块 的 大 小 、 可 用 内 存 块 数 、 正 在 使 用 的 内 存 块 数 等 信 
息 。 


15.7 pnC/OS-II 的 文件 体系 


HC/OS-II 的 文件 体系 如 图 15-2 所 示 。 读 者 需要 注意 的 是 ， 此 处 是 
以 V2.91 版 本 为 例 给 出 的 文件 体系 ， 而 《 同 入 式 实时 操作 系统 nC/OS-II 
(第 2 版 ) 》 一 书 给 出 的 文件 体系 是 以 V2.52 版 本 为 例 ， 两 者 稍微 有 点 
不 同 ， 读 者 朋友 在 阅读 的 时 候 可 以 对 比 区 分 。 


从 图 中 可 以 发 现 ，hC/OS-I 的 代码 可 以 分 为 四 部 分 。 


。 与 处 理 器 无 关 的 代码 : 这 就 是 JC/OS-II 内 核 的 全 部 代码 。 

。 与 具体 处 理 器 相关 的 代码 : 对 每 一 种 处 理 器 ， 此 处 的 代码 都 
有 区 别 ， 移 植 hHC/OS-I 主 要 就 是 修改 此 部 分 的 代码 。 图 15-2 
中 ， 该 部 分 的 文件 是 参照 移植 到 M14K 处 理 器 列 出 的 ， 移 植 
到 其 他 处 理 器 时 ， 该 部 分 的 文件 可 能 会 有 差别 ， 比 如 本 章 将 
hC/OS-II 移 植 到 OpenMIPS 处 理 器 时 ， 就 没有 其 中 的 CPU_A.S 
文件 。 


应 用 程序 
〈 用 户 代 码 ) 
uC/OS-II E 
(与 处 理 器 无 关 代 码 ) se 
OS DBG RC 
OS_CORE.C 
OS_FLAG.C 
OS_MBOX.C APP_CFG.H 
OS_MEM.C OS_CFG.H 
OS_MUTEX.C L 
a INCLUDES.H 
OS_SEM.C 
OS_TASK.C 
OS_TIME.C 
OS_TMR.C 
uCOS ILC 
uCOS_ILH 
uC/OS-II 
(与 具体 处 理 器 相关 代码 ) 
OS_CPU.H 
CPU.H 
CPU_A.S 
OS_CPU_A.S 
OS_CPU_C.C 


图 15-2 pC/OS-T 的 文件 体系 (以 V2.91 为 例 ) 


。 与 应 用 相关 的 代码 : 与 用 户 应 用 程序 相关 的 头 文件 。 
。 用 户 代码 : 用 户 编写 的 应 用 程序 。 


15.8 ”nC/OS-II 的 移植 条 件 


移植 就 是 使 一 个 操作 系统 能 够 在 某 个 微 处 理 器 平台 或 微 控制 器 上 
运行 。 为 了 方便 移植 ，hC/OS-I 的 大 部 分 代码 使 用 C 语 言 编写 ， 但 是 仍 


需要 用 C 语 言 和 汇编 语言 编写 一 些 与 处 理 器 硬件 相关 的 代码 ， 这 是 因 


为 HC/OS-II 在 访问 处 理 器 的 寄存 器 时 ， 只 能 通过 汇编 语言 来 实现 ， 这 
部 分 对 应 的 也 就 是 图 15-2 中 的 “与 具体 处 理 器 相关 代码 ”。 由 于 hC/OS-II 
在 设计 之 初 就 已 经 充分 考虑 了 可 移植 性 ， 所 以 hC/OS-I 的 移植 相对 来 
说 是 比较 容易 的 。 为 了 移植 hC/OS-II， 目 标 处 理 器 必须 满足 以 下 条 
件 。 


1. 处 理 器 的 C 编 译 器 能 产生 可 重 入 代码 


可 重 入 代码 指 的 是 可 被 多 个 任务 同时 调用 ， 而 不 会 破坏 数据 的 一 
段 代 码 。hC/OS-I 是 多 任务 内 核 ， 阔 数 可 能 会 被 多 个 任务 调用 ， 代 码 
的 可 重 入 性 是 保证 完成 多 任务 的 基础 。 


可 重 入 代码 中 不 应 该 有 全 局 变量 或 静态 变量 ， 因 为 这 些 变量 会 保 
存 某 一 个 进程 的 修改 。 可 重 入 代码 中 的 变量 应 该 都 是 局 部 变量 ， 每 次 
重新 调用 时 变量 被 重新 赋值 ， 从 而 保证 ， 每 个 进程 对 它 的 调用 都 产生 
同样 的 结果 。 图 15-3 列 举 了 两 个 函数 作为 例子 ， 它 们 的 区 别 在 于 变量 
temp 不 同 ， 左 边 函 数 中 的 temp 作 为 全 局 变量 存在 ， 右 边 函 数 中 的 temp 
作为 局 部 变量 存在 ， 因 此 左边 的 函数 是 不 可 重 入 的 ， 而 右边 的 函数 是 
可 重 入 的 。 


int temp; void swap(int * x, int * y) 
f 


void swap(int * x, int * y) 


int temp; 

\ temp = *x; 
temp = "x; Hy = Fy 
ae y: 
ee *y = temp; 

y = temp; 1 


1 
j 


图 15-3 ”不 可 重 入 代码 与 可 重 入 代码 示例 


为 了 产生 可 重 入 代码 ， 除 了 在 C 程 序 中 使 用 局 部 变量 ， 还 需要 C 编 
译 器 的 支持 ， 本 书 一 直 在 使 用 的 MIPS 编 译 器 能 生成 可 重 入 代码 。 


2. 用 C 语 言 可 打开 和 关闭 中 断 


OpenMIPS 处 理 器 的 CP0 中 有 Status 寄 存 器 ， 其 最 低位 为 中 断 使 能 
标志 了 ， 通 过 设置 该 位 的 值 ， 能 够 打开 、 关 闭 中 断 。 人 参考 10.2 世 。 


3. 处 理 器 支持 中 断 并 且 能 产生 定时 中 断 


hC/OS-I 是 通过 处 理 器 产生 的 时 钟 节拍 中 断 来 实现 多 任务 调度 
的 。 而 OpenMIPS 处 理 器 支持 中 断 ， 并 且 能 产生 时 钟 中 断 ， 满 足 此 处 的 
要 求 。 


4。 处 理 器 支持 能 够 容纳 一 定量 数据 的 硬件 堆栈 
OpenMIPS 的 寻 址 空间 达到 4GB ， 完 全 能 满足 堆栈 需求 。 


5. 处理 器 有 将 堆栈 指针 和 CPU 其 余 寄 存 器 读 出 和 存储 到 堆栈 
(或 内 存 ) 的 指令 


hC/OS-I 进 行 任务 调度 时 ， 会 把 当前 任务 的 CPU 寄存 器 存放 到 此 
任务 的 堆栈 中 ， 然 后 再 从 另 一 个 任务 的 堆栈 中 恢复 原来 的 工作 寄存 
器 ， 从 而 继续 运行 男 一 个 任务 ， 所 以 需要 压 栈 、 出 栈 指令 。 而 
OpenMIPS 处 理 器 具有 lw、sw 等 加 载 存 储 指令 ， 能 够 实现 压 栈 、 出 
栈 。 


综合 上 述 分 析 可 知 ，hC/OS-II 能 够 被 移植 到 OpenMIPS 处 理 器 上 。 


从 图 15-2 可 知 ， 移 植 涉 及 的 文件 既 有 C 代 码 ， 也 有 汇编 代码 ， 必 然 
涉及 两 者 的 混合 编程 ， 还 涉及 函数 调用 ， 所 以 ， 为 了 更 好 地 理解 移植 
过 程 ， 读 者 朋友 应 该 首先 阅读 接 下 来 的 两 节 : C 语 言 中 使 用 汇编 代 
码 、MIPS 函 数 调 用 规范 。 如 果 对 这 两 小 节 的 内 容 比 较 熟 悉 ， 那 么 可 以 
直接 阅读 15.11 节 ， 进 入 移植 过 程 。 


15.9 ”CC 语言 中 使 用 汇编 代码 


内 核 代 码 的 绝 大 部 分 使 用 C 语 言 编写 ， 只 有 一 小 部 分 使 用 汇编 语 
545, 例如: 与 特定 体系 结构 相关 的 代码 、 对 性 能 影响 很 大 的 代 
码 。SDE MIPS 编 译 器 提供 了 内 徐汇 编 的 功能 ， 可 在 C 代码 中 直接 内 散 
汇编 语句 ， 方 便 了 程序 设计 。 一 个 简单 的 内 语汇 编 示 例如 下 。 


asm volatile ("syscall") 


“asm” 表 示 后 面 的 代码 为 内 富 汇 编 ;“volatile” 用 来 告诉 编译 器 不 要 
优化 此 处 的 代码 ， 以 使 后 面 的 指令 保留 原样 ; 括号 里 面 是 汇编 指令 ， 
此 处 就 是 系统 调用 指令 syscall。 


AREA Fo 
asm (汇编 语句 模板 : 输出 部 分 : 输入 部 分 : 破坏 描述 部 分 ) 


共 四 个 部 分 : 汇编 语句 模板 ， 输 出 部 分 ， 输 入 部 分 ， 破 坏 描 述 音 
分 ， 各 部 分 使 用 “:” 分 隔 开 ， 汇 编 语句 模板 必 不 可 少 ， 其 余 三 部 分 可 
选 。 如 果 某 一 部 分 没有 使 用 ， 但 其 后 面 的 部 分 使 用 了 ， 那 么 要 为 其 保 
留 位置 。 对 这 四 个 部 分 分 别 说 明 如 下 。 


1. 汇编 语句 模板 


汇编 语句 模板 由 汇编 语句 序列 组 成 ， 语 句 之 间 使 用 “;*"、“/n” 或 
“/n/t* 人 分开。 指令 中 的 操作 数 可 以 使 用 占 位 符 引 用 C 语 言 变量 ， 占 位 符 
最 多 10 个 ， 名 称 如 下 : %0, %1, ... %9。 指 令 中 使 用 占 位 符 表示 的 操 
作 数 ， 总 被 认为 long 型 (4 个 字 节 ) ， 但 对 其 施加 的 操作 根据 指令 可 以 
是 半 字 或 者 字 节 ， 当 把 操作 数 当 做 半 字 或 者 字 节 使 用 时 ， 默 认为 低 半 
字 或 者 LSB。 对 字 节 操作 可 以 显 式 地 指明 是 低 字 节 还 是 高 字 节 。 方法 
是 在 “%” 和 序号 之 间 插 入 一 个 字母 ，“b” 代 表 低 字 节 ，“h” 代 表 高 字 节 ， 
例如 : %h2。 


2. 输出 部 分 


输出 部 分 描述 输出 操作 数 ， 不 同 的 操作 数 描述 符 之 间 用 逗号 格 
开 ， 每 个 操作 数 描述 符 由 限定 字符 串 和 C 语 言 变 量 组 成 。 每 个 输出 操 
作 数 的 限定 字符 串 必 须 包 含 “=” 表 示 它 是 一 个 输出 操作 数 。 限 定 字符 串 
与 具体 的 处 理 器 架构 有 关 ， 常 用 限定 字符 串 与 MIPS 架 构 可 能 用 到 的 限 
定 字符 串 如 表 15-1 所 示 。 


表 15-1 ”内 由 汇编 中 常用 限定 字符 串 的 描述 


限定 字符 串 描述 
地 址 寄存 器 


将 操作 数 放 入 通用 寄存 器 


将 操作 数 放 入 浮 点 寄存 器 


| sd 操作 数 放 在 内 存 或 通用 寄存 器 。 | 内 存 或 通用 寄存 器 


er 
er 


操作 数 是 内 存 变 量 ， 但 是 其 寻 址 方式 是 偏 移 量 


类 型 ， 也 即 是 基 址 寻 址 ， 或 者 是 基 址 加 变 址 寻 


操作 数 是 一 个 16 位 有 符号 常数 
操作 数 是 一 个 16 位 无 符号 常数 


操作 数 是 一 个 32 位 有 符号 常数 ， 且 该 常数 的 低 


16 位 都 为 0 


mr aren cz mR 


een 但 寻 址 方式 不 是 偏 移 量 类 


一 一 a 


输 出 操作 数 表 达 式 是 只 \ E 的 


EDESA 
Al) 


amp; 输出 操作 数 表 达 式 独占 为 其 指定 的 寄存 器 | 
3。 输 入 部 分 


输入 部 分 描述 输入 操作 数 ， 不 同 的 操作 数 描述 符 之 间 用 逗号 格 
开 ， 每 个 操作 数 描述 符 由 限定 字符 串 和 C 语 言 表达 式 或 者 C 语 言 变 量 组 
成 。 与 输出 部 分 不 同 之 处 在 于 限定 字符 串 不 需要 包含 “=”。 


4. 破坏 描述 部 分 


通常 编写 程序 只 使 用 一 种 语言 : 高 级 语言 或 者 汇编 语言 。 高 级 语 
言 编译 的 步骤 大 致 经 过 : 预 处 理 -> 编译 -> 汇编 -> 链接 ， 我 们 这 里 只 
心 其 中 的 编译 ， 用 来 将 高 级 语言 转换 成 汇编 代码 。 在 转换 的 过 程 中 ， 
所 有 的 寄存 器 都 由 编译 器 决定 如 何 分 配 使 用 ， 编 译 器 有 能 力 保证 寄存 
器 的 使 用 不 会 冲突 。 如 果 全 部 使 用 汇编 语言 ， 则 由 程序 员 去 控制 寄存 
器 的 使 用 ， 也 能 避免 寄存 器 冲突 。 但 是 如 果 两 种 语言 混合 使 有 用， 情况 
就 变 复杂 了 ， 因 为 内 上 伦 的 汇编 代码 可 以 直接 使 用 寄存 器 ， 而 编译 器 并 
不 去 检查 内 适 的 汇编 代码 使 用 了 哪些 寄存 器 。 因 此 ， 需 要 一 种 机 制 告 
知 编译 器 我 们 使 用 了 哪些 寄存 器 (程序 员 自 己 知 道内 启 汇 编 代码 中 使 
用 了 哪些 寄存 器 ) ， 否 则 对 这 些 寄存 器 的 使 用 就 有 可 能 导致 错误 ,，“ 破 
坏 描述 部 分 ?就 起 这 个 作用 。 破 坏 描 述 部 分 由 逗号 隔 开 的 字符 串 组 成 ， 
每 个 字符 串 描 述 一 种 情况 ， 一 般 是 寄存 器 名 ， 此 外 还 有 “memory”。 当 
然 ， 在 内 能 汇编 的 输入 、 输 出 部 分 指明 的 寄存 器 或 者 指定 为 拉 ”、“ 吧 
型 由 编译 器 去 分 配 的 寄存 器 就 不 需要 在 破坏 描述 部 分 描述 ， 因 为 编译 
器 已 经 知道 了 。 


上 面 介绍 的 概念 比较 枯燥 ， 还 是 通过 例子 来 理解 ， 读 者 只 需要 理 
解 这 两 个 例子 ， 因 为 在 移植 hC/OS-I 的 过 程 中 也 只 使 用 到 了 这 两 种 形 


陈 。 
例 一 : asm ("mfc0 %0,$13" : "=r"(cause_val)) 


指令 是 mfc0 ， 读 取 协 处 理 器 CP0 中 Cause 寡 存 器 的 值 ， 保 存 到 
cause val 中， 并 且 cause_val 是 通用 寄存 器 。 


例 二 : asm volatile("mtc0 %0,$12" : :"r"(0x10000401)) 


中 令 是 mtcO0， 设 置 协 处 理 器 CPO 中 Status 寄 存 器 的 值 为 
0x10000401。 注 意 : 此 处 只 有 输入 部 分 ， 没 有 输出 部 分 ， 但 是 要 为 输 
出 部 分 保留 位 置 。 


15.10 MIPS 国 数 调用 规范 


在 移植 hC/OS-I 的 过 程 中 ， 甚 至 在 以 后 的 应 用 中 ， 都 可 能 使 用 C 语 
言 和 MIPS 汇 编 语言 进行 混合 编程 ， 必 然 涉 及 两 者 之 间 的 相互 调用 ， 
此 理解 函数 调用 规范 对 移植 、 对 程序 设计 都 有 很 大 的 帮助 。 


本 节 的 函数 调用 规范 是 以 MIPS ABI o32 版 本 为 例 进行 讲解 。ABI 
是 一 种 接口 定义 与 规范 ， 编 译 系统 需要 使 用 这 个 规范 编译 和 链接 程 
序 ， 因 此 ABI 可 以 说 是 高 级 语言 编写 的 应 用 程序 转化 为 二 进 制 可 执行 
代码 的 标准 。ABI 涵 盖 了 各 种 细节 ， 如 : 数据 类 型 的 大 小 、 布 局 和 对 
齐 ; 调用 约定 (控制 着 图 数 的 参数 如 何 传送 以 及 如 何 接收 返回 值 ) ; 
寄存 器 使 用 规范 ; 系统 调用 的 编码 和 一 个 应 用 如 何 向 操作 系统 进行 系 
统 调用 等 等 。MIPS ABI 有 三 个 版 本 : o32、n32、n64。 


15.10.1 ”寄存 器 使 用 规范 


MIPS ABI o32 定 义 的 寄存 器 使 用 规范 在 第 1 章 已 经 给 出 ， 此 处 为 
方便 读者 阅读 ， 再 次 给 出 ， 如 表 15-2 所 示 。 在 本 章 的 讲解 中 会 经 常 使 
用 该 表 。 


表 15-2 ”寄存 器 使 用 规范 


寄存 器 名 字 约定 命名 


o p CCC 
TT 用 来 存放 子 程序 返回 值 


$4~$7 a0~a3 调用 子 程序 时 ， 使 用 这 4 个 寄存 
器 传输 前 4 个 非 浮 点 参数 
使 用 时 可 
sess oo 


子 程序 寄存 器 变量 ， 改 变 这 些 
寄存 器 值 的 子 程序 必须 存储 上 
16~$23 s0~s7 
= 的 值 并 在 退出 前 恢复 ， 对 调用 
程序 来 说 值 不 变 


-s el 


526, $27 | $27 o joo [ernennen __ 


15.10.2 ”参数 传递 


程序 的 运行 过 程 往 往 会 涉及 子 阔 数 的 调用 ， 而 函数 调用 需要 传递 
参数 ，MIPS ABI 032 规 范 中 ， 参 数 传递 有 两 种 方法 : 使 用 堆栈 、 使 用 
寄存 器 。 分 别 说 明 如 下 。 


1. 使 用 堆栈 传递 参数 


堆栈 就 是 内 存 中 的 一 段 存 储 空 间 ， 其 中 可 以 存储 局 部 变量 、 保 存 
寄存 器 值 、 传 递 参 数 。MIPS 架 构 的 硬件 没有 专用 的 堆栈 操作 指令 ， 所 
有 的 堆栈 操作 都 是 使 用 加 载 、 存 储 指令 实现 的 。 堆 栈 的 生长 方向 是 从 
高 地 址 到 低地 址 ， 寄 存 器 sp ( 即 $29， 参 考 表 15-2) 指向 当前 栈 底 。 


为 数 调用 时 可 以 使 用 堆栈 传递 参数 。 调 用 函数 在 堆栈 上 建立 一 
数据 结构 来 放置 参数 ， 然 后 使 用 sp 指向 它 ， 第 一 个 参数 (C 源 代码 中 
最 左边 的 函数 参数 ) 放 在 最 低位 置 ， 每 个 参数 至 少 占用 一 个 字 (32 
位 ) 的 空间 。o32 规 定 至 少 要 有 16 字 节 的 栈 空 间 用 于 参数 的 传递 。 如 图 
15-4 所 示 。 


= 加 ‘i 高 地 址 
更 多 参数 占用 的 空间 
(在 前 面 16 字 节 存 放 不 下 的 情况 ) 


放置 参数 4 
放置 参数 3 
放置 参数 2 


程序 进入 时 的 sp 放置 参数 1 y 低地 址 


图 15-4 “使 用 堆栈 传递 参数 
2。 使 用 寄存 器 传递 参数 


为 了 提高 程序 的 运行 效率 ， 避 免 耗 时 的 内 存 加 载 和 存储 操作 (也 
就 是 对 堆栈 的 操作 ) ，MIPS ABI o32 规 范 中 约定 将 前 16 个 字 节 所 对 应 
的 参数 通过 寄存 器 来 传递 ， 但 同时 保留 堆栈 上 的 这 16 个 字 节 空间 为 
空 。 即 ， 使 用 寄存 器 传递 前 4 个 参数 ， 但 仍 保留 图 15-4 中 的 4 个 参数 
槽 ， 只 是 不 使 用 而 已 。 用 来 传递 参数 的 4 个 通用 寄存 器 是 a0-a3 (Bl 
$4-$7， 人 参考 表 15-2) o 


关于 MIPS ABI o32 规 范 中 的 参数 传递 ， 可 以 总 结 如 下 : 首先 ,无 
论 函 数 参 数 有 多 少 ， 调 用 函数 都 需要 在 堆栈 上 开辟 至 少 16 个 字 节 的 空 
间 用 于 参数 传递 ; 其 次 ， 如 果 4 个 通用 寄存 器 足够 用 于 参数 传递 ， 那 么 
参数 就 不 需要 存储 到 堆栈 中 开辟 的 16 个 字 节 的 空间 中 ， 直 接 通过 通用 
寄存 器 a0-a3 传 递 参 数 ， 通 用 寄存 器 放 不 下 的 参数 需要 存储 在 堆栈 中 开 
辟 的 16 个 字 节 以 上 的 空间 中 。 


15.10.3 ŽUR EÁ 


MIPS ABI 032 规 范 中 ， 整 数 类 型 或 者 指针 类 型 的 水 数 返 回 值 会 放 
入 寄存 器 v0 ( 即 $2 ， 参 考 表 15-2) 中 ， 而 返回 long long 类 型 的 数据 
时 ， 也 会 使 用 寄存 器 v1 〈 即 $3) o 


如 果 返 回 一 个 结构 体 或 其 他 很 大 的 值 ， 不 能 在 寄存 器 Y0、v1 中 完 
全 返回 ， 需 要 做 如 下 处 理 : 调用 函数 开辟 一 段 内 存 缓冲 区 ， 使 用 一 个 
指针 指向 这 块 缓冲 区 ， 并 将 这 个 指针 作为 第 一 个 参数 ， 通 过 寄存 器 
a0， 传 给 被 调用 函数 。 当 被 调用 函数 执行 完成 时 ， 将 返回 值 复制 到 这 
块 内 存 缓冲 区 中 ， 同 时 将 寄存 器 v0 指 向 该 内 存 缓冲 区 。 


15.10.4 ”堆栈 布局 


MIPS ABI o32 规 范 中 ， 函 数 的 堆栈 如 图 15-5 所 示 (该 图 只 是 非 叶 
子孙 数 的 堆栈 ) 。 前 文 已 述 ， 堆 栈 是 从 高 地 址 向 低地 址 生长 的 。 


调用 函数 栈 
高 地 址 


更 多 参数 占用 的 空间 
(在 前 面 16 字 节 存放 不 下 的 情况 ) 


放置 参数 4 
放置 
BUA 
程序 进入 时 的 sp > 放置 


局 部 变量 和 临时 值 


Y 


SH |W] wo 


Ny 


整数 寄存 器 存储 区 域 


浮 点 寄存 器 存储 区 域 


:地 址 
被 调用 函数 栈 低地 


图 15-5“ 非 叶子 函数 的 堆栈 帧 
图 中 灰色 区 域 是 函数 自身 需要 的 栈 空 间 ， 其 上 部 属于 调用 者 。 


PRET ATF EX. FRPP FRR HF PRET I BS ERE 
AM. CNAE AMA ARABE), TARE REM 
到 寄存 器 t0-t7、a0-a3 以 及 v0、v1， 这 些 寄 存 器 在 使 用 之 前 不 需要 保存 
其 中 的 值 。 


非 叶 子 国 数 是 会 调用 其 他 函数 的 国 效 。 一 般 来 进 ， 非 叶子 函 效 在 
运行 之 前 ， 需 要 将 寄存 器 ra 以 及 其 他 需要 事先 保存 的 寄存 器 保存 到 堆 


Mo 
15.10.5 “示例 


ULA FR EAB AS EROS AM Lo 
1. 参数 传递 示例 


示例 代码 如 下 ， 作 用 是 将 传 入 的 参数 number 作 为 GPIO 模 块 的 输 
出 。 


// 将 number 作 为 GPI0 的 输出 ， 其 中 GPIO_BASE 是 GPI0 模 块 的 基地 址 ， 在 小 型 SOPC 
A, 
// 即 为 0xX20000000，GPIO0_0UT_REG 是 GPIO0 输 出 寄存 器 的 地 址 ， 为 0x4。 下 述 代码 


// 将 number 存 储 到 地 址 9ox20000004， 也 就 是 设置 GPI0O 模 块 的 输出 为 number。 


void gpio_out(INT32U number ) 


{ 
REG32(GPIO_BASE + GPIO_OUT_REG) = number; 


上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 。 将 寄存 器 a0 的 值 存 
储 到 地 址 0x20000004， 根 据 15.10.2 节 介绍 的 参数 传递 可 知 ， 寄 存 器 a0 
中 保存 的 正 是 传递 进来 的 参数 number。 


<gpio_out>: 


lui v0,0x2000 


ori v0,v0,0x4 


sw a0,0(vO) # 将 寄存 器 ag 的 值 保存 到 90x20000004 
jr ra # 寄存 器 ra 保存 的 是 返回 地 址 ， 此 处 就 是 返回 到 调用 程序 
nop 


2。. 销 数 返 回 值 示 例 
示例 代码 如 下 ， 作 用 是 读 取 GPIO 的 输入 。 


//GPIO_BASE 是 6PI0 模 块 的 基地 址 ,在 小 型 SOPC 中 ， 即 为 6x20000000， 
GPIO_IN_REGE 

//GPI0O 输 入 寄存 器 的 地 址 ， 为 0x9， 所 以 下 述 代 码 就 是 读 取 地 址 为 0ox20000000 处 的 
值 ， 并 返回 

// 该 值 ， 也 就 是 读 取 GPI0 的 输入 

INT32U gpio_in() 


INT32U temp = 0; 
temp = REG32(GPIO_BASE + GPIO_IN_REG); 
return temp; 

} 


上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 ， 主 要 内 容 是 加 载 
0x20000000 处 的 字 ， 保 存 到 寄存 器 v0 中 ， 然 后 返回 ， 正 是 15.10.3 节 介 
绍 的 函数 返回 规范 所 要 求 的 。 


<gpio_in>: 
lui v1,0x2000 
lw v0,0(v1) # 加 载 0x20000000 处 的 字 ， 保 存 到 寄存 器 v0 中 


jr ra # 寄存 器 ra 保存 的 是 返回 地 址 ， 此 处 就 是 返回 到 调用 程序 


nop 


3。. 非 叶子 函数 堆栈 布局 示例 


示例 代码 如 下 ， 这 是 用 户 创 建 的 一 个 任务 ， 其 中 初始 化 定时 器 ， 
每 隔 100ms 通 过 串口 输出 Info 数 组 中 的 两 个 字 节 ， 同 时 改变 GPIO 的 输 
er ee i 绍 ， 读 者 此 时 只 
需要 明日 一 上 中 一 一 这 个 遂 数 是 非 叶 子 立 数 ， 因 为 在 其 中 会 调用 
OSInitTick、uart_putc、 gpio_out、OSTimeDly 等 疯 数 。 我 们 需要 考察 
的 是 其 堆栈 布局 。 


void TaskStart (void *pdata) 


{ 
INT32U count = 0; 
pdata = pdata; /* 没有 作用 ， 仅 仅 是 防止 编译 器 给 出 告警 信息 
A 
OSInitTick(); /* 初始 化 定时 器 
S 
for (55) { 
if(count <= 102) 
{ 
uart_putc(Info[count]); /* 通过 串口 输出 Info 中 的 两 个 字 
fe uy 


uart_putc(Info[count+1] ); 
} 
gpio_out(count); /* 改变 6PI0 的 输出 
27 


上 述 C 代 码 在 编译 后 ， 会 得 到 如 下 汇编 指令 〈 只 截取 前 几 条 指 


令 ) 。 


首先 将 堆栈 指针 sp 减 去 48， 也 就 是 向 低地 址 方向 移动 12 个 字 。 然 
后 将 寄存 器 ra、s6、s5、s4、...s0 依 次 压 入 堆栈 。 如 图 15-6 所 示 。 这 样 
在 遂 数 TaskStart 内 部 就 可 以 自 由 使 用 寄存 器 ra、 só, SOx S4、 .. .SO 了 。 


4. 叶子 函数 堆栈 布局 示例 


上 面 给 出 的 参数 传递 示例 、 函 数 返回 值 示例 都 是 叶子 为 效 ， 所 以 
此 处 不 再 单独 给 出 叶子 永 数 示例 。 从 那 两 个 示例 对 应 的 汇编 代码 可 以 
发 现 ， 叶 子 函 数 不 需 要 堆栈 (实际 上 ， 根 据 需 要 也 可 以 拥有 堆栈 ) ， 
没有 要 保存 的 寄存 器 。 


a 、 
高 地 址 
调用 函数 栈 


程序 进入 时 的 sp 


被 调用 函数 栈 


vy 低地 址 
图 15-6 TaskStart 国 数 运 行 时 的 堆栈 


15.11 phnC/OS-II 在 OpenMIPS 处 理 
器 上 的 移植 


有 了 前 几 节 介绍 的 背景 知识 ， 现 在 就 可 以 开始 移植 nyC/OS-II 到 
OpenMIPS 处 理 器 了 。 


根据 目标 处 理 器 的 不 同 ， 移 植 hC/OS-I 需 要 修改 50-300 行 代码 。 
最 方便 的 途径 是 修改 现 有 的 移植 代码 ， 比 如 本 章 要 将 hC/OS-II 移 植 到 
OpenMIPS 处 理 器 ， 那 么 可 以 借鉴 nC/OS-II 在 其 它 MIPS 架 构 处 理 器 上 
的 移植 代码 ， 在 其 基础 上 进行 修改 。 


15.11.1 文件 目录 的 建立 


本 小 节 将 建立 代码 文件 的 目录 ， 分 以 下 步骤 。 


1. 在 Ubuntu 虚拟 机 中 新 建文 件 夹 ucosii _OpenMIPS ， 作 为 整个 移 
植 过 程 的 根 目录 。 


2. 从 http://micrium.com/ 下 载 nC/OS-II 的 源 代码 ， 版 本 是 v2.91。 
在 本 书 附带 光盘 Code\ucosii sourcecode 目 录 下 也 提供 了 全 部 源 代码 ， 
文件 名 是 uCOS-II-V290.ZIP。 解 压缩 后 ， 包 含 的 代码 文件 如 图 15-7 所 
示 。 


3. 在 ucosii _ OpenMIPS 目 录 下 新 建文 件 夹 cos， 将 hC/OS-II 源 代码 
的 文件 〈 除 了 os_cfg_rh、ucos iih 两 个 头 文 件 之 外 ) 复制 到 ucos 文 件 
夹 下 。 


图 15-7 phC/OS-I 源 代码 提供 的 文件 


4. 从 http:/micrium.com/ 下 载 针 对 MIPS M14K 的 phC/OS-II 移 植 代 
人 码 ， 版 本 是 v2.90。 本 书 附带 光盘 的 Code\ucosii_sourcecode 目 录 下 也 提 
供 了 移植 代码 ， 文 件 名 是 uCOS-IL_ M14K.zip。 MIPS M14K 是 MIPS 科 
技 于 2009 年 发 布 的 首 款 执行 microMIPS 指 令 集 架构 的 MIPS32 兼 容 内 
核 。microMIPS 指 令 集 架 构 集成 了 16 位 和 32 位 优化 指令 的 高 性 能 代码 
压缩 技术 ， 保 持 了 98% 的 MIPS32 性 能 ， 同 时 减少 了 至 少 30% 的 代码 体 
只 ， 从 而 降低 心 片 成 本 ， 也 有 助 于 降低 系统 功 耗 。 本 章 的 移植 工作 就 
是 在 针对 MIPS M14K 的 hC/OS-II 移 植 代码 的 基础 上 修改 完成 的 。 移 植 
代码 的 文件 如 图 15-8 所 示 。 注 意 : 这 几 个 文件 并 不 在 同一 个 文件 夹 
下 ， 此 处 只 是 为 了 显示 方便 而 将 其 复制 到 同一 个 文件 夹 下 。 


'cpu. hi cpu_a.s os_cpu.h os_cpu_a.5 05 cpuc.c 


图 15-8 ”针对 MIPS M14K 的 nC/OS-II 移 植 代码 


5. 在 ucosii OpenMIPS 目 录 下 新 建文 件 夹 port， 将 针对 MIPS 
M14K 的 nC/OS-II 移 植 代码 中 的 os_cpu_a.S、os_cpu_c.c 两 个 文件 复制 到 
该 文件 夹 下 。 


6. 在 ucosii OpenMIPS 目 录 下 新 建文 件 夹 include ， 将 hC/OS-II 源 
代码 中 的 ucos_iih、os_cfg_rh 两 个 头 文 件 ， 以 及 针对 MIPS M14K 的 
hC/OS-II 移 植 代 码 中 的 cpuh、os_cpuh 两 个 头 文件 ， 一 共 四 个 头 文件 
复制 到 该 文件 夹 下 ， 并 将 os_cfg_rh 重 命名 为 os_cfg.h， 注 意 : 在 重 命 
名 前 需要 去 掉 该 文件 的 只 读 属性 ， 否 则 无 法 重 命名 。 


7. 在 include 目 录 下 新 建文 件 includes.h， 内 容 如 下 。 


#include <stdarg.h> 
#include <stddef.h> 
#include <limits.h> 


#include "ucos_ii.h" 


主要 是 因为 针对 MIPS M14K 的 nC/OS-II 移 植 代码 中 的 0s_cpu_c.c 文 
件 需要 引用 includes.h 文 件 ， 所 以 此 处 添加 该 文件 。 


8. 在 include 目 录 下 新 建文 件 app_cfg.h， 内 容 如 下 。 
#ifndef _APP_CFG_H_ 
#define _APP_CFG_H_ 


#define 0S_TASK_TMR_PRIO (OS_LOWEST_PRIO - 2) 


#endif 


从 V2.81 版 本 开始 ，hC/OS-II 增 加 了 周期 性 (Periodic) 和 一 次 性 
(One-Shot) 的 定时 器 功能 。 用 户 程序 最 多 可 以 使 用 65500 个 定时 器 ， 
这 些 定 时 器 由 一 个 定时 器 管理 任务 进行 管理 ， 该 任务 的 优先 级 就 定义 
在 刚刚 新 建 的 app_cfg.h 文 件 中 ， 即 OS_TASK_TMR_PRIO。 


9. 修改 includes 目 录 下 的 cpu.h 文 件 ， 去 把 其 中 对 如 下 两 个 头 文 件 
的 引用 ， 因 为 移植 过 程 没有 用 到 这 两 个 头 文 件 。 


/* 去 掉 如 下 代码 : */ 
#include <cpu_def.h> 


#include <cpu_cfg.h> 


10. 在 ucosii _ OpenMIPS 目 录 下 新 建 common 文 件 夹 ， 其 中 用 于 存 
放 测 试 程序 。 


经 过 上 述 步 又 ， 就 建立 了 代码 文件 的 目录 ， 如 图 15-9 所 示 。 接 下 
来 需要 修改 部 分 代码 ， 主 要 是 修改 port 目 录 下 的 文件 以 及 os_cpu.h 文 
件 ， 以 实现 移植 hC/OS-II 到 OpenMIPS 处 理 器 。 由 于 本 章 的 移植 是 建立 
在 针对 MIPS M14K 的 移植 代码 基础 之 上 的 ， 所 以 并 不 会 有 大 的 改动 ， 
只 有 一 些 细微 的 修改 ， 但 是 如 果 笔 者 只 介绍 这 些 细微 的 修改 ， 读 者 难 
免 会 有 盲人 摸 象 的 感觉 ， 对 移植 需要 做 的 工作 、 移 植 的 原理 还 是 不 清 
楚 ， 所 以 ， 笔 者 决定 详细 介绍 port 中 的 每 个 文件 以 及 os_cpu.h 文 件 ， 以 
帮助 读者 理解 。 


ucosii_OpenMIPS 


> uos 包含 kLC/OS-II 源 代码 的 大 部 分 文件 


05_core.c 
os_dbg fc 
os_flag.c 
os_mbox.¢ 
os_mem.c 
os_mutex.c 
> os q.c 
os_sem.c 
os_task.c 
os_time.c 
os_tmr.c 
ucos_ii.c 


> port 包含 与 具体 处 理 器 有 关 的 源 代 码 文件 


os_cpu_a.S 
OS_cpu_c.c 


> include 包含 头 文件 


app_cfg.h 
cpu.h 
includes.h 
os_cfg.h 
os_cpu.h 
ucos_ii.h 


> common 包含 用 户 程序 


图 15-9 ”代码 文件 的 目录 


15.11.2 ”修改 os_cpu.h 文 件 


os_cpu.h 文 件 定义 了 与 处 理 器 相关 的 常量 、 宏 、 结 构 体 。 主 要 内 
容 如 下 ， 完 全 可 以 使 用 针对 MIPS M14K 的 移植 代码 ， 不 用 修改 。 


1. 数据 类 型 定义 


因为 不 同 的 处 理 器 有 不 同 的 字 长 ， 所 以 hC/OS-I 包 含 了 一 系列 的 
数据 类 型 定义 ， 以 确保 其 可 移植 性 。 尤 其 是 ，phC/OS-II 代 码 从 不 使 用 C 
语言 中 的 short、int、long 等 数据 类 型 ， 因 为 它们 是 与 编译 器 相关 的 ， 
是 不 可 移植 的 。hC/OS-I 使 用 自己 定义 的 数据 类 型 ， 如 下 所 示 。 


YP EP ERIE LE UE EEE GENS BPE 


BP Ls EPR GEE ER EG OE EES EI] 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 


typedef 


unsigned 
unsigned 
Signed 
unsigned 
Signed 
unsigned 
Signed 
float 
double 


unsigned 


E320 */ 


typedef 


unsigned 


char 
char 
char 
short 
short 
int 


int 


int 


int 


数据 类 型 定义 ， 


BOOLEAN; 
INT8U; 
INT8S; 
INT16U; 
INT16S; 
INT32U; 
INT32S; 
FP32; 
FP64; 


volatile 


与 编译 器 有 关 


/* 无 符号 8 位 整数 */ 
/* 有 符号 8 位 整数 */ 
/* 无 符号 16 位 整数 */ 
/* 有 符号 16 位 整数 */ 
/* 无 符号 32 位 整数 */ 
/* 有 符号 32 位 整数 */ 


OS_STK; /* SERRE, 


OS_CPU_SR; 


比如 ， 如 果 某 一 处 理 器 的 编译 器 认为 int 是 有 符号 16 位 整数 ， 而 不 


Eshort, BA 


aa 
ne 


要 将 INT16S 前 面 的 的 short 改 为 int 即 可 ， 不 用 修改 


hC/OS-I 的 其 余 代 码 ， 以 此 确保 可 移植 性 。 
2. 进 、 出 临界 区 的 宏 


如 果 某 操作 不 希望 被 打 断 ， 那 么 可 将 该 操作 放 入 临界 区 中 ， 
phC/OS-II 在 进入 临界 区 之 前 要 禁止 中 断 ， 操 作 完 毕 后 ， 退 出 临界 区 需 
要 开 中 断 。hC/OS-I 定 义 了 两 个 安 来 进入 临界 区 、 退 出 临界 区 ， 其 中 
就 分 别 实现 茶 止 中 断 、 开 中 断 。 这 两 个 安 的 定义 如 下 。 


[FRE RARA 进 En IA A 区 的 JA 


OP PSE TSP LP LE SE AE E A 


#define OS _ENTER_CRITICAL( ) cpu_sr = OS_CPU_SR_Save(); 
#define 0S_EXIT_CRITICAL() OS_CPU_SR_Restore(cpu_sr); 


其 中 OS CPU SR Save, OS CPU SR ad D BRI BX TE X fF 
0s_cpu_a.S 中 定义 ， 会 在 15.11.3 节 介绍 KEA 


有 了 这 两 个 宏 ， 执 行 临 界 区 代码 的 过 程 如 下 。 


OS_CPU_SR cpu_sr; 
OS_ENTER_CRITICAL() 
临界 区 代码 


OS_EXIT_CRITICAL( ) 


3. 定义 堆栈 生长 方向 


大 多 数 处 理 器 的 堆栈 是 从 高 地 址 向 低地 址 生长 的 ， 但 也 有 部 分 处 
理 器 相反 。hC/OS-I 被 设计 成 对 这 两 种 情况 都 可 以 处 理 ， 只 要 配置 如 
下 的 安定 义 即 可 。 


#define 0S_STK_GROWTH 1 


当 OS_STK_GROWTH 等 于 1 时 ， 表 示 堆 栈 的 生长 方向 是 从 高 地 址 
向 低地 址 ， 当 0OS_STK_GROWTH 等 于 0 时 ， 表 示 堆 栈 的 生长 方向 是 从 
低地 址 向 高 地 址 。 对 OpenMIPS 处 理 器 而 言 ， 此 处 设置 为 1。 


4. 用 于 任务 切换 的 宏 定义 


#define 0S_TASK_SW() asm("\tsyscall\n"); 


宏 定 义 O0S_TASK_SW0 实 现 了 任务 切换 ， 是 在 hC/OS-I 从 低 优先 
级 任务 切换 到 高 优先 级 任务 时 需 用 到 的 。 从 定义 中 可 以 发 现 该 宏 定 义 
实际 就 是 系统 调用 指令 syscall。 


假如 任务 TaskA 在 执行 过 程 中 ， 由 于 某 种 原因 需要 执行 任务 
TaskB， 且 TaskB 的 优先 级 高 于 TaskA， 那 么 可 以 在 TaskA 中 执行 任务 切 
换 宏 OS_TASK_SW()， 后 者 会 引发 系统 调用 异常 ， 进 入 异常 处 理 例 
程 。 在 异常 处 理 例 程 的 最 后 ，hC/OS-I 会 查找 当前 优先 级 最 高 的 就 绪 
任务 开始 执行 ， 于 是 就 会 执行 TaskB， 从 而 实现 了 低 优 先 级 任务 向 高 
优先 级 任务 的 切换 。 


5。 一 些 函 数 声明 


os_cpuh 文 件 的 最 后 给 出 了 一 些 函 数 声明 ， 这 些 函 数 在 文件 
os_cpu_a.S 中 定义 ，15.11.3 小 节 会 详细 说 明 。 


void OSIntCtxSw(void); 

void OSStartHighRdy(void) ; 

void ExceptionHandler (void); 

void InterruptHandler (void); 

void TickInterruptClear(void); 

void CoreTmrInit(CPU_INT32U tmr_reload); 
void TickISR(CPU_INT32U tmr_reload); 


OS_CPU_SR OS_CPU_SR_Save(void); 
void OS_CPU_SR_Restore(0S_CPU_SR); 


15.11.3 ”修改 os_cpu_a.5 文 件 


os_cpu_a.S 文 件 定义 了 异 单 处 理 例 程 ， 此 外 还 定义 了 一 
11 TEX, 40 Fo 


II 
dk 
x% 


e OS_CPU_SR_Save 

e OS_CPU_SR_Restore 
e InterruptHandler 

e OSIntCtxSw 


e ExceptionHandler 


OSStartHighRdy 
TickInterruptClear 


e CoreTmrInit 
e TickISR 


DisableInterruptSource 


EnableInterruptSource 
分 别 介绍 如 下 。 


1. 异常 处 理 例 程 


其 中 定义 了 stack 段 、 定 义 了 异常 处 理 例 程 。 代 码 如 下 。 


la $26,main /* 寄存 器 $26、$27 留 给 异常 处 理 程序 使 用 */ 
jr $26 


nop 


/25 中 断 异 常 ， 对 应 的 入 口 地 址 是 0x20 
ERSTE ABLE ES ES OE EES ES EES To VA 
,Org 0x20 
la $26, InterruptHandler 
jr $26 


nop 


/**** 系统 调用 异常 、 无 效 指令 、 溢 出 异常 、 自 陷 异 常 ， 对 应 的 入 口 地 址 是 9x40 
****/ 
.Org 0x40 
la $26, ExceptionHandler 
jr $26 


nop 


上 述 代码 很 好 理解 。 首 先 定 义 了 堆栈 段 ， 大 小 是 0x10000 字 节 。 然 
后 定义 了 vectors 段 ， 其 中 包括 三 个 异常 处 理 例 程 。 


1) 复位 异常 ， 对 应 的 处 理 例 程 入 口 地 址 是 0x0。 在 其 中 初始 化 
全 局 指针 寄存 器 gp、 堆 栈 指针 麻 存 器 sp， 然 后 转移 到 main 阅 数 。 其 中 
将 _stack_addr 的 值 作为 sp 的 初始 值 ，_stack_addr 是 在 链接 指示 文件 
ram.ld 中 定义 的 (参考 15.13 节 ) ， 对 应 的 是 堆栈 的 最 高 地 址 。 


(2) 中 断 异 常 ， 对 应 的 处 理 例 程 入 口 地 址 是 0x20。 在 其 中 直接 转 
移 到 函数 mterruptHandler 进 行 中 断 处 理 。 读 者 可 能 会 有 疑问 ， 一 般 而 


言 ， 异 常 处 理 之 前 应 该 先 保护 现场 ， 即 保存 所 有 寄存 器 的 值 ， 此 处 在 
没有 保护 现场 的 情况 下 就 使 用 了 寄存 器 $26 ， 会 不 会 出 问题 ? 保护 现场 
的 工作 在 函数 InterruptHandler 中 进行 ， 此 处 在 没有 保护 现场 的 情况 下 
就 使 用 了 寄存 器 $26， 是 因为 寄存 器 $26 (以 及 青 存 器 $27) 就 是 给 异常 
处 理 程序 使 用 的 ， 其 它 程序 不 使 用 ， 所 以 修改 了 也 没关系 ， 参 考 表 15- 
2o 


(3) 系统 调用 异常 、 无 效 指 令 、 洪 出 异常 、 自 陷 异 常 ， 对 应 的 处 
理 例 程 入 口 地 址 是 0x40。 在 其 中 直接 转移 到 函数 ExceptionHandler 进 行 
异常 处 理 。 此 处 也 使 用 了 寄存 器 $26。 


需要 注意 的 是 ， 在 代码 中 使 用 了 la 指令 ， 这 是 一 个 汇编 指令 ， 是 
与 编译 器 有 关 的 指令 ， 用 来 将 指定 的 地 址 加 载 到 寄存 器 ， 其 等 价 于 如 
下 两 条 机 器 指令 。 


//1a 指 令 用 来 将 指定 的 地 址 加 载 到 寄存 器 ， 等 价 于 两 条 机 器 指令 ， 如 下 ， 
// 其 中 %hi(addr ) 表 示 addr 的 高 16bit，%1o(addr) 表 示 addr 的 低 16bit 
la rt, addr => lui $2, %hi(addr) 

addiu $2, $2, %lo(addr) 


2。 一 些 常数 


0s_cpu_a.S 定 义 了 出 入 堆栈 使 用 到 的 一 些 常数 定义 。 


. equ STK_OFFSET_SR, 4 

.equ STK_OFFSET_EPC, STK_OFFSET_SR + 4 
equ STK_OFFSET_LO, STK_OFFSET_EPC t4 
‚equ STK_OFFSET_HI, STK_OFFSET_LO + 4 
equ STK_OFFSET_GPR1, STK_OFFSET_HI + 4 


.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 
.equ 


.edu 


STK_OFFSET_GPR2, 

STK_OFFSET_GPR3, 

STK_OFFSET_GPR4, 

STK_OFFSET_GPR5, 

STK_OFFSET_GPR6, 

STK_OFFSET_GPR7, 

STK_OFFSET_GPR8, 

STK_OFFSET_GPRO, 

STK_OFFSET_GPR10, 
STK_OFFSET_GPR11, 
STK_OFFSET_GPR12, 
STK_OFFSET_GPR13, 
STK_OFFSET_GPR14, 
STK_OFFSET_GPR15, 
STK_OFFSET_GPR16, 
STK_OFFSET_GPR17, 
STK_OFFSET_GPR18, 
STK_OFFSET_GPR19, 
STK_OFFSET_GPR20, 
STK_OFFSET_GPR21, 
STK_OFFSET_GPR22, 
STK_OFFSET_GPR23, 
STK_OFFSET_GPR24, 
STK_OFFSET_GPR25, 
STK_OFFSET_GPR26, 
STK_OFFSET_GPR27, 
STK_OFFSET_GPR28, 


STK_OFFSET_GPR1 
STK_OFFSET_GPR2 
STK_OFFSET_GPR3 
STK_OFFSET_GPR4 
STK_OFFSET_GPR5 
STK_OFFSET_GPR6 
STK_OFFSET_GPR7 
STK_OFFSET_GPR8 
STK_OFFSET_GPR9 
STK_OFFSET_GPR10 
STK_OFFSET_GPR11 
STK_OFFSET_GPR12 
STK_OFFSET_GPR13 
STK_OFFSET_GPR14 
STK_OFFSET_GPR15 
STK_OFFSET_GPR16 
STK_OFFSET_GPR17 
STK_OFFSET_GPR18 
STK_OFFSET_GPR19 
STK_OFFSET_GPR20 
STK_OFFSET_GPR21 
STK_OFFSET_GPR22 
STK_OFFSET_GPR23 
STK_OFFSET_GPR24 
STK_OFFSET_GPR25 
STK_OFFSET_GPR26 
STK_OFFSET_GPR27 


BR hb A HB HP A A A HR HR A A A A A A A A A A A A A A 上 FA 


„equ STK_OFFSET_GPR30,  STK_OFFSET_GPR28 + 4 

„equ STK_OFFSET_GPR31, | STK_OFFSET_GPR30 + 4 

.equ STK_CTX_SIZE, STK_OFFSET_GPR31 + 4  /* 堆栈 的 大 小 
E 


从 常数 的 名 称 上 可 以 分 析 ， 这 些 常数 定义 了 对 应 的 寄存 器 在 堆栈 
中 的 位 置 (相对 于 sp 的 偏 移 ) ， 如 图 15-10 所 示 。 当 异常 发 生 时 ， 会 按 
照 图 15-10 的 次 序 将 各 个 寄存 器 保存 到 堆栈 ， 在 后 文 解释 函数 
InterruptHandler 时 会 详 述 。 另 外 ， 上 述 定 义 中 的 STK_CTX_SIZE 表 示 
堆栈 的 大 小 。 


$31 个 高 地 址 


rss. 


EPC 


S SR 低地 址 
p > Vv 


图 15-10 ”寄存 器 在 堆栈 中 的 保存 位 置 


3. BARROS _CPU_SR_ Save 


作用 是 读 取 协 处 理 器 CP0 中 Status 寄 存 器 的 值 ， 同 时 禁止 中 断 ， 子 
效 声明 如 下 。 


CPU_SR OS _CPU_SR_Save(void); 


该 国 数 有 一 个 返回 值 ， 返 回 的 是 CP0 中 Status 寄 存 器 的 值 。 函 数 定 
义 如 下 。 


‚ent OS _CPU_SR_Save 
OS_CPU_SR_Save: 


ori $2,$2,0x0 


mfcO $2,$12,0 + 获取 Status 寄 人 存 器 的 值 ， 保 存 到 寄存 器 $2 中 
addi $3,$0,0xfffe # 设置 寄存 器 $3 的 值 为 9oxfffffffe 

and $3,$2,$3 # $3 与 $2 的 值 相 与 ， 结 果 保 存 到 $3 中 

mtcO $3,$12,0 # 修改 后 的 寄存 器 $3 的 值 保 存 到 Status 寄 存 器 
jr $31 # 返回 

nop 


,end OS CPU_SR_ Save 


首先 获取 当前 Status 寄 存 器 的 值 ， 保 存 到 寄存 器 v0 ( 即 程序 中 的 
$2) 中 ， 然 后 修改 其 最 低位 为 0， 修 改 后 的 值 保 存 到 v1 〈 即 程序 中 的 
$3) 中 ， 再 将 v1 的 值 保存 到 Status 寄 存 器 ， 由 于 v1 的 最 低位 为 0， 从 而 
禁止 中 断 〈 人 参考 10.2 节 对 Status 寄 存 器 的 说 明 ) 。 最 后 返回 。 


根据 MIPS 函 数 调 用 规范 可 知 ， 阔 数 返 回 值 一 般 放 在 寄存 器 v0 中 ， 
而 此 时 v0 的 值 正 是 修改 之 前 Status 寄 存 器 的 值 。 满 足 规范 要 求 ， 达 到 了 
ZS ERIE AY H Yo 


4. BIOS CPU_SR_ Restore 


FAEERE Status Fash, KARR, MAUL 
效 有 一 个 传 入 参数 。 


void OS_CPU_SR_Restore(CPU_SR sr); 
图 数 定义 如 下 。 
.ent OS_CPU_SR_Restore 
OS_CPU_SR_Restore: 


jr $31 
mtcO $4, $12, O // 参 数 是 通过 寄存 器 ago ( 即 $4) FAN 


,end 0S_CPU_SR_Restore 


根据 MIPS 阔 数 调用 规范 可 知 ， 参 数 是 通过 寄存 器 a0-a3 (Bl 
$4-$7) 传递 的 ， 所 以 上 述 代 码 很 好 理解 ， 将 传 入 参数 存储 到 协 处 理 器 
CP0 中 的 Status 寄 存 器 。 需 要 注意 的 是 ， 上 述 代 码 将 mtc0 指 令 放 在 延迟 
fa, 


(IS 7) AT SEP AY EEX, IRR AA ACV IAW 15.1073 FT ZA BY MIPS ER BX 
调用 规范 有 了 更 加 深刻 的 理解 了 吧 。 


5. b@UnterruptHandler 


ER MEXMNPHAURBSIEF, SERRE AHR 
InterruptHandler， 进 行 中 断 处 理 ， 函 数 InterruptHandler 的 定义 如 下 。 


lw 


mtcoO 


lw 
lw 
mtlo 


mtlo 


lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 


$8, 
$8, 


$8, 
$9, 
$8 
$9 


$31, 
$30, 
$28, 
$27, 
$26, 
$25, 
$24, 
$23, 
$22, 
$21, 
$20, 
$19, 
$18, 
$17, 
$16, 
SUS; 
$14, 
$13, 


STK_OFFSET_EPC($29) 
$14, © 


STK_OFFSET_LO($29) 
STK_OFFSET_HI($29) 


STK_OFFSET_GPR31($29) 
STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR13($29) 


ie 


ie 
JE 


VER 


恢复 寄存 器 EPC */ 


注意 其 中 使 用 到 的 汇编 指令 1i， 这 是 与 编译 器 有 关 的 指令 ， 用 来 
将 立即 数 加 载 到 寄存 器 ， 等 价 于 ori 指 令 ， 如 下 。 


li rt, immediate 等 价 于 ori rt,$0,immediate 


另外 ， 其 中 部 分 and 指 令 采 用 了 简化 方式 ， 如 下 ， 编 译 器 可 以 识 
别 。 在 后 面 还 会 遇 到 or 指令 ， 也 采用 了 类 似 的 简化 方式 。 


and rd,rs 等 价 于 and rd,rd,rs 
上 述 代码 可 以 分 为 六 段 理 解 。 


第 一 段 : 保护 现场 ， 也 就 是 将 各 个 寄存 器 的 值 保 存 到 堆栈 ， 保 存 
的 格式 就 是 图 15-10 所 示 。 注 意 : 不 用 保存 堆栈 指针 寄存 器 Sp (EN 
$29) 。 


第 二 段 : 首先 获取 变量 OSIntNesting 的 值 ， 然 后 分 两 种 情况 。 


。 如果 为 零 ， 那 么 需要 将 被 中 断 任务 的 堆栈 指针 保存 到 该 任务 
的 任务 控制 块 (BNOSTCBCur) 中 。 参 考 15.5.1 节 给 出 的 任务 
控制 块 的 结构 体 定义 ， 其 第 一 个 元 素 就 是 堆栈 指针 ， 所 以 此 
处 直接 将 寄存 器 sp 保存 到 OSTCBCur 指 向 的 地 址 ， 该 地 址 对 
应 就 是 任务 控制 块 中 的 堆栈 指针 这 个 元 素 。 然 后 将 变量 
OSIntNesting 加 1。 

。 如 果 不 为 零 ， 那 么 直接 将 变量 OSIntNesting 加 1。 


hC/OS-I 需 要 知道 正在 做 中 断 服务 ， 这 样 只 要 变量 OSIntNesting 不 
为 0， 就 表示 处 于 中 断 处 理 过 程 中 。 


第 三 段 : 中 断 处理 过 程 。 读 取 Cause 寄 存 器 的 值 ， 获 得 其 中 的 IP 字 
段 ， 该 字段 位 于 Cause 寄 存 器 的 第 8-15bit。 然 后 判断 卫 字 段 中 是 否 
1， 有 1 融 表 示 有 中 断 友 生 ， 那 么 会 进入 具体 的 中 断 处 理 函 数 
BSP_Tnterrupt_Handler 进 行 处 理 ， 该 函数 在 os_cpu_c.c 中 定义 ， 会 在 
15.11.4 节 详细 说 明 。 中 断 处 理 结束 后 ， 还 要 再 次 判断 是 否 有 中 断 发 
生 ， 如 果 还 有 中 断 ， 那 么 再 次 进入 函数 BSP_Interrupt_Handler 进 行 处 
理 ， 如 此 反复 ， 直 到 没有 中 断 为 止 。 


第 四 段 : 中 断 处 理 结束 ， 此 时 需要 调用 函数 OSIntExit。 OSIntExit 
会 将 变量 OSIntNesting 减 1， 当 OSIntNesting 减 到 0 时 ， 表 示 所 有 钥 套 的 
中 断 都 处 理 结束 。 此 时 ，pC/OS-II 需 要 判断 是 否 有 更 高 优先 级 的 任务 
HAMAS (中 断 处 理 过 程 可 能 会 唤醒 更 高 优先 级 的 任务 ) o WR 
有 ， 那 么 就 调用 函数 OSIntCtxSw 以 实现 切换 到 优先 级 更 高 的 任务 继续 
执行 ， 反 之 ， 回 到 原来 被 中 断 的 任务 。 其 过 程 如 图 15-11 所 示 。 


| 


将 变量 OSIntNesting 减 1 


oe 


一 一 0SIntNesting 为 0， 且 有 更 高 优先 级 的 任务 处 于 就 绪 态 “一 否 一 启 。 返回 


Fz 


调用 函数 OSIntCtkgSW， 切 换 到 高 优先 级 的 任务 


图 15-11 函数 OSIntExit 的 处 理 流 程 


疯 数 OSIntExit 是 在 文件 os_core.c 中 定义 的 ， 无 需 修改 。 图 15-11 中 
数 OSIntCtxSw 是 在 文件 os_cpu_a.S 中 定义 的 ， 本 节 接 下 来 会 介绍 


效 。 


FAR: 从 堆栈 中 恢复 各 个 寄存 器 的 值 。 注 意 : 不 用 恢复 寄存 器 
sp (BP$29) o 


第 六 段 : 调用 指令 eret 实 现 返 回 。 指 令 eret 会 将 麻 存 器 EPC 的 值 赋 
给 取 指 寄存 器 PC， 作 为 新 的 取 指 地 址 。 


再 进一步 思考 ， 如 果 第 四 段 中 ， 满 足 “"OSIntNesting 为 0， 且 有 更 高 
优先 级 的 任务 处 于 就 绪 态 ”这 个 条 件 ， 那 么 会 切换 到 更 高 优先 级 的 任务 
继续 执行 ， 而 当前 被 中 断 的 任务 就 会 进入 就 绪 态 ， 该 任务 的 堆栈 指针 
sp 存放 在 其 任务 控制 块 中 ， 在 堆栈 中 保存 了 所 有 寄存 器 的 值 ， 如 图 15- 
12 所 示 。 实 际 上 ， 这 就 是 处 于 就 绪 态 的 任务 的 普遍 状态 ， 有 了 这 个 认 
识 ， 就 比较 容易 理解 下 面 将 要 解释 的 国 数 OSIntCtxSwo。 


$31 个 高 地 址 
$30 
$1 
$0 
HI 
LO 

任 务 控制 块 EPC 

1 

x i SR y 低地 址 


图 15-12 ”就 绪 态 任务 的 普遍 状态 
6. MÉOSIntCtxSw 


国 数 OSIntCtxSw 的 作用 在 图 15-11 中 已 经 提 到 ， 简 单 来 说 ， 就 是 切 
到 高 优先 级 的 任务 继续 执行 。 代 码 如 下 所 示 。 


lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 


$31, 
$30, 
$28, 
$27, 
$26, 
$25, 
$24, 
$23, 
$22, 
$21, 
$20, 
$19, 
$18, 
$17, 
$16, 
5115; 
$14, 
$13, 
$12, 
$11, 
$10, 
$9, 

$8, 

$7, 

$6, 

$5, 

$4, 


STK_OFFSET_GPR31($29) /* 恢复 整数 寄存 器 */ 


STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR12($29) 
STK_OFFSET_GPR11($29) 
STK_OFFSET_GPR10($29) 
STK_OFFSET_GPR9($29) 

STK_OFFSET_GPR8($29) 

STK_OFFSET_GPR7($29) 

STK_OFFSET_GPR6($29) 

STK_OFFSET_GPR5($29) 

STK_OFFSET_GPR4($29) 


lw $3, STK_OFFSET_GPR3($29) 
lw $2, STK_OFFSET_GPR2($29) 
lw $1, STK_OFFSET_GPR1($29) 


addi $29, $29, STK_CTX_SIZE /* 调整 堆栈 指针 */ 


[RRR RRR RRR KK KR KKK 2 2 2 2 2 KK KK KK KK 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 KK KK KKK 
炎炎 
TR RRR RRR RR Re 第 0 几 œ 

段 : 返回 
火 火 火 火 火 火 火炎 火炎 炎炎 炎炎 大 


EXAXXRXKXKXARXKAKXAXKAKXKXKXAKXKXKXAXKXXAXK XK XK XXX KK KA KKXKXXXxX0% 


mete A 
eret /* 返回 */ 


,end OSIntCtxSw 
上 述 代 码 可 以 分 为 四 段 理解 。 


第 一 段 : 调用 钩子 水 数 OSTaskSwHook， 该 水 数 在 文件 os_cpu_c.c 
中 定义 ， 默 认为 空 ， 用 户 可 以 在 其 中 填充 自己 的 代码 ， 每 次 任务 切换 
ABS Val FAK KX. 


第 二 段 : 更 新 当前 任务 的 优先 级 OSPrioCur 及 其 任务 控制 块 指针 
OSTCBCur 这 两 个 变量 ,分 别 等 于 目前 处 于 就 绪 态 的 具有 最 高 优先 级 
的 任务 的 优先 级 OSPrioHighRdy 及 其 任务 控制 块 指针 OSTCBHighRdyo 


第 三 段 : 恢复 新 任务 的 寄存 器 。 从 图 15-12 可 知 ， 就 绪 态 任务 的 堆 
栈 指针 就 是 任务 控制 块 的 第 一 个 元 素 ， 所 以 可 以 从 任务 控制 块 中 获取 
堆栈 指针 。 之 后 ， 从 堆栈 中 恢复 各 个 寄存 器 。 


第 四 段 : 使 用 指令 eret 返 回 ， 指令 eret 会 将 寄存 器 EPC 的 值 赋 给 取 
指 寄 存 器 PC， 作 为 新 的 取 指 地 址 。 


如 此 就 实现 了 任务 切换 。 


7. BIBRExceptionHandler 


在 前 文 定 义 的 系统 调用 异常 、 无 效 指令 、 溢 出 异常 、 自 陷 异 常 的 
处 理 例 程 中 ， 会 直接 转移 到 六 数 ExceptionHandler， 进 行 异 单 处 理 。 子 


2X ExceptionHandlerfY = X40 Fo 


.ent ExceptionHandler 


ExceptionHandler: 


AIRE IE IE E DEUS OF UE EE US OF UE BE UE OF UE DEUS OP UE ES E IES LORE CELE ES ES EES LP 


** 


KKEKKKKKKKKKEK 第 一 段 : 保护 现场 ， 寄存 器 压 栈 KKEKKKKKKKKKKKE 


kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk 
EES 


addi $29, $29, -STK_CTX_SIZE /* 调整 堆栈 指针 */ 


SW $1, STK_OFFSET_GPR1($29) /* 保存 整数 寄存 器 */ 
Sw $2, STK_OFFSET_GPR2($29) 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


SW 


$3, 

$4, 

$5, 

$6, 

$7, 

$8, 

$9, 

$10, 
$11, 
$12, 
$13, 
$14, 
$15, 
$16, 
$17, 
$18, 
$19, 
$20, 
$21, 
$22, 
$23, 
$24, 
$25, 
$26, 
$27, 
$28, 
$30, 


STK_OFFSET_GPR3($29) 

STK_OFFSET_GPR4($29) 

STK_OFFSET_GPR5($29) 

STK_OFFSET_GPR6($29) 

STK_OFFSET_GPR7($29) 

STK_OFFSET_GPR8($29) 

STK_OFFSET_GPR9($29) 

STK_OFFSET_GPR10($29) 
STK_OFFSET_GPR11($29) 
STK_OFFSET_GPR12($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR30($29) 


lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 


$30, 
$28, 
$27, 
$26, 
$25, 
$24, 
$23, 
$22, 
$21, 
$20, 
$19, 
$18, 
$17, 
$16, 
$15, 
$14, 
$13, 
$12, 
$11, 
$10, 
$9, 

$8, 

$7, 

$6, 

$5, 

$4, 

$3, 


STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR12($29) 
STK_OFFSET_GPR11($29) 
STK_OFFSET_GPR10($29) 
STK_OFFSET_GPR9($29) 

STK_OFFSET_GPR8($29) 

STK_OFFSET_GPR7($29) 

STK_OFFSET_GPR6($29) 

STK_OFFSET_GPR5($29) 

STK_OFFSET_GPR4($29) 

STK_OFFSET_GPR3($29) 


lw $2, STK_OFFSET_GPR2($29) 
lw $1, STK_OFFSET_GPR1($29) 


addi $29, $29, STK_CTX_SIZE /* 调整 堆栈 指针 */ 


[RRR RRR RRR KKK 2 2 2 2 2 2 2 2 KK KK KK KK 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 KK KK KK KK KK 
k* 
HKERERERERE RAR 第 0 Jl. ` 

段 : 返回 
类 炎炎 炎炎 炎炎 类 类 类 类 类 类 类 大 


人 


EST 
eret /* 返回 */ 


.end ExceptionHandler 


bk SNExceptionHandler5 12% InterruptHandler A A AKA — t, (8 
是 更 加 简单 ， 可 分 为 四 段 理 解 。 


第 一 段 : 保护 现场 ， 就 是 将 各 个 寄存 器 保存 到 堆栈 ， 同 时 将 当前 
任务 的 堆栈 指针 sp 《〈 即 寄存 器 $29) 保存 到 任务 控制 块 OSTCBCur 中 , 
保存 后 的 格式 就 是 图 15-12 所 示 。 


第 二 段 : 调用 具体 的 异常 处 理 疯 数 BSP_Exception_Handler 进 行 异 
常 处 理 。 该 水 数 在 文件 os_cpu_c.c 中 定义 ， 在 15.11.4 节 会 有 详细 说 明 。 
其 中 将 进行 任务 切换 。 


第 三 段 : 由 于 在 函数 BSP_Exception_Handler 中 会 进行 任务 切换 ， 
所 以 从 函数 BSP_Exception_Handler 返 回 后 ，OSTCBCur 可 能 不 是 指向 
被 异 单 打 断 的 任务 的 任务 控制 块 。 不 管 是 不 是 ， 都 要 从 OSTCBCur 中 
获得 将 要 执行 的 任务 的 堆栈 指针 ， 然 后 依据 该 堆栈 指针 恢复 各 个 寄存 
器 。 


第 四 段 : 使 用 指令 eret 返 回 ，eret 会 将 寄存 器 EPC 的 值 屿 给 取 指 寄 
存 器 PC， 作 为 新 的 取 指 地 址 。 


8. RIÉROSStartHighRdy 


hC/OS-I 在 启动 前 要 至 少 创建 一 个 任务 ， 新 创建 的 任务 处 于 就 绪 
态 。 然 后 LC/OS-II 可 以 调用 水 数 OSStart 实 现 启动 。OSStart 从 任务 就 绪 
表 中 找 出 用 户 建立 的 优先 级 最 高 的 任务 ， 并 调用 水 数 OSStartHighRdy 
以 执行 该 优先 级 最 高 的 任务 。OSStartHighRdy 的 代码 如 下 。 


„ent OSStartHighRdy 
OSStartHighRdy: 


[RES UIE SLE USES SEE UIE US ES LEA UE UIE LES DE UN EE URE UN DENE CES ELSE LES STES SESS LESS LESS LES SLES LESS Ed 
“x 


类 炎炎 炎炎 类 类 类 类 类 类 大 大 第 一 段 : 调用 钧 子 了 图 数 0STaskSwHook kkkxkxkkkkkkxkxkxk 


ER KR KEKE KEKE KERR KEKE KEKE KERR KEKE KER KEKE KEKE KEKE REKER KK KT KT KK KT KK ERKE 


EL 


la $8, OSTaskSwHook 
jalr $8 /* WAFBSSFRIROSTaskSwHook */ 


lw 


mtcoO 


lw 
lw 
mtlo 


mthi 


lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 
lw 


$8, 
$8, 


$8, 
$9, 
$8 
$9 


$31, 
$30, 
$28, 
$27, 
$26, 
$25, 
$24, 
$23, 
$22, 
$21, 
$20, 
$19, 
$18, 
$17, 
$16, 
5115; 
$14, 
$13, 
$12, 


STK_OFFSET_EPC($29) 


$14, © /* MES 


STK_OFFSET_LO($29) 
STK_OFFSET_HI($29) 


STK_OFFSET_GPR30($29) 
STK_OFFSET_GPR28($29) 
STK_OFFSET_GPR27($29) 
STK_OFFSET_GPR26($29) 
STK_OFFSET_GPR25($29) 
STK_OFFSET_GPR24($29) 
STK_OFFSET_GPR23($29) 
STK_OFFSET_GPR22($29) 
STK_OFFSET_GPR21($29) 
STK_OFFSET_GPR20($29) 
STK_OFFSET_GPR19($29) 
STK_OFFSET_GPR18($29) 
STK_OFFSET_GPR17($29) 
STK_OFFSET_GPR16($29) 
STK_OFFSET_GPR15($29) 
STK_OFFSET_GPR14($29) 
STK_OFFSET_GPR13($29) 
STK_OFFSET_GPR12($29) 


存 器 EPC */ 


从 代码 上 人 分析， 函数 OSStartHighRdy 的 主要 工作 就 是 从 当前 最 高 
优先 级 的 任务 的 堆栈 恢复 各 个 寄存 器 。 这 一 过 程 与 之 前 介绍 的 函数 


OSIntCtxSw 是 一 样 的 ， 两 者 的 代码 也 极为 相似 。 可 以 分 为 四 段 理 解 。 


第 一 段 : 调用 钩子 国 数 OSTaskSwHook， 该 图 数 在 文件 os_cpu_c.c 
中 定义 ， 其 内 容 默认 为 空 ， 用 户 可 以 填充 自己 的 代码 。 


His — 


第 二 段 : 设置 操作 系统 运行 标志 OSRunning 为 True (BN1) ， 表 示 
操作 系统 开始 运行 了 。 


第 三 段 : 恢复 处 于 就 绪 态 的 具有 最 高 优先 级 的 任务 的 寄存 器 。 从 
图 15-12 可 知 ， 融 绪 态 任务 的 堆栈 指针 放 在 任务 控制 块 中 ， 所 以 首先 从 
任务 控制 块 中 获取 堆栈 指针 ， 人 然后 可 以 从 堆栈 中 恢复 各 个 寄存 器 。 


第 四 段 : 使 用 jr 指令 返回 。 这 一 点 是 与 水 数 OSIntCtxSw 的 最 大 不 
同 ， 后 者 使 用 eret 指 令 返 回 ， 进 入 新 任务 执行 。 而 此 处 是 使 用 jr 指令 进 
入 新 任务 执行 。 这 是 因为 在 新 任务 创建 的 时 候 ， 会 将 任务 的 入 口 地 址 
存放 在 寄存 器 $31 中 ， 所 以 此 处 使 用 jr $31 指 令 ， 就 会 转移 到 新 任务 开 
始 执 行 。 读 者 在 阅读 15.11.4 节 解释 辫 数 OSTaskStkInit 的 时 候 ， 能 够 对 
此 有 更 直观 的 体会 。 


9. BX&XTickInterruptClear 


当 协 处 理 器 CP0 中 的 Compare 寄 存 器 等 于 Count 寄 存 器 时 ， 会 引发 
时 钟 中 断 ， 时 钟 中 断 会 持续 声明 ， 直 到 修改 了 Compare 寄 存 器 的 值 。 
函数 TickInterruptClear 的 作用 就 是 通过 将 Compare 寄 存 器 置 为 0， 从 而 
清除 时 钟 中 断 声 明 。 其 代码 如 下 。 


.ent TickInterruptClear 


TickInterruptClear: 


mtcO $0, $11 /* 设置 Compare 寄 存 器 为 9 */ 
jr $31 /* 返回 */ 


nop 


.end TickInterruptClear 
10. E&XCoreTmrInit 


本 函数 负责 初始 化 定时 器 ， 也 就 是 设置 Compare 寄 存 器 的 值 ， 同 
时 将 Count 寄 存 器 清 零 。 函 数 声明 如 下 ， 从 中 可 知 该 玉 数 有 一 个 输入 参 
数 tmr_reload， 就 是 要 设置 给 Compare 寄 存 器 的 值 。 


void CoreTmrInit(CPU_INT32U tmr_reload); 


了 为 数 代 码 如 下 。 其 中 将 寄存 器 $4 的 值 赋 给 寄存 器 Compare ， 人 参考 
15.10.2 节 MIPS 国 数 调用 中 的 参数 传递 规范 可 知 ， 寄 存 器 $4 中 保存 的 惑 
是 传 入 的 参数 tmr_reload。 


,ent CoreTmrinit 


CoreTmrinit: 
mtcO $4, $11 /* 设置 Compare 寄 存 器 */ 
nop 
mtco $0, $9 /* {count FFAS */ 
jr $31 

nop 


.end CoreTmrinit 


11. BAXTickISR 


中 断 发 生 时 会 调用 水 数 BSP_Interrupt_Handler 进 行 处 理 ， 如 果 是 时 
钟 中 断 ， 那 么 会 进一步 调用 本 函数 TickISR 进 行 处 理 ， 其 作用 是 增加 
Compare 寄 存 器 的 值 ， 这 样 不 仅 清除 了 时 钟 中 断 声 明 ， 而 且 新 加 的 数 
值 还 确定 了 下 一 次 时 钟 中 断 的 发 生 时 刻 〈 当 寄存 器 Count 等 于 寄存 器 
Compare 的 新 值 时 ， 又 会 发 生 时 钟 中 断 ) 。 函 数 声 明 如 下 ， 从 中 可 知 
该 狼 数 有 一 个 输入 人 参数 tmr_reload ， 惑 是 要 给 寄存 器 Compare 增 加 的 
值 。 


void TickISR(CPU_INT32U tmr_reload); 


国 效 代码 如 下 。 


,ent TickISR 


TickISR: 


[SEIS EOS LOS EE US UE LEU OEY EOS LEVIES LOS AT UND US EE Ud DE IE CS Rec A CES SLES eo ses Ce se 
“x 


类 炎炎 类 炎炎 类 类 类 大 大 第 一 段 : 保存 部 分 寄存 器 KKKKKKKKKE 


KEKEKEKKEKKKEKE KEKE KEKE KEKE KEKE KEKE KEKE KEK KEKE KEK KK XXX KEKE KEKE XK KKXKXXXX% 


EL 


addiu $29,$29, -24 

SW $16, 0x4($29) 

SW $8, 0x8($29) 

SW $31, OxC($29) /* 将 寄存 器 $8、$16、$31 讨 栈 */ 


lw $31, 0xC($29) /* 从 堆栈 恢复 寄存 器 $8、$16、$31 */ 
lw $16, 0x4($29) 
lw $8, 0x8($29) 
addiu $29, $29, 24 


[RRR RRR RR KKK RR KKK 2 2 2 2 KK KK KK 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 KR KKK KK KKK 

炎炎 

RKERERERER ER 第 Jl. X 
AR: 返回 

类 炎炎 炎炎 类 类 类 大 大 


人 


人 


jr $31 /* 返回 */ 


nop 


.end TickISR 
上 述 代 码 可 以 分 为 五 段 理解 。 


第 一 段 : 因为 在 函数 中 又 要 调用 函数 OSTimeTick， 所 以 需要 保存 
部 分 寄存 器 。 首 先 将 堆栈 指针 sp 向 下 移 ， 预 留 24 个 字 节 的 空间 。 然 
后 ， 把 函数 中 使 用 到 的 寄存 器 $8、$16、$31 保 存 到 堆栈 。 


第 二 段 : 获取 Compare 寄 存 器 的 当前 值 ， 然 后 与 寄存 器 $4 相 加 ， 
加 法 的 结果 再 保存 回 Compare 寄 存 器 。 人 参考 15.10.2 节 MIPS 孙 数 调用 中 
的 参数 传递 规范 可 知 ， 寄 存 器 $4 中 保存 的 就 是 传 入 参数 tmr_reload。 


=F: 调用 函数 OSTimeTick， 以 通知 操作 系统 有 一 个 时 钟 中 断 
Bi AR RENT 修改 。 


FIR: 从 堆栈 恢复 保存 的 寄存 器 。 
FAR: 返回 。 


截止 到 目前 ， 已 经 提 到 了 好 几 个 与 中 断 有 关 的 处 理 函 数 ， 包 括 
InterruptHandler, BSP_Interrupt_Handler, OSIntExit, OSIntCtxSw , 
TickISR 等 ， 其 中 国 数 OSIntExit 位 于 hC/OS-I 中 与 处 理 器 无 关 的 部 分 ， 
函数 BSP_Tmterrupt_Handler 将 在 15.11.4 节 介绍 ， 其 余 的 3 个 

国 数 都 已 介绍 ， 读 者 可 能 觉得 它们 之 间 的 关系 比较 混乱 ， 在 此 做 一 说 
明 。 这 几 个 函数 的 关系 如 图 15-13 所 示 。 


InterruptHandler 


BSP_Interrupt_Handler 
TickISR 
‚org 0x20 
la $26,InterruptHandler a 
jr $26 
nop OSIntExit 
OSIntCtxSw 


图 15-13 ”中 断 处 理 相 关 阔 数 的 天 系 


中 断 发 生 时 ， 首 先 转移 到 0x20 处 ， 然 后 跳 转 到 函数 
InterruptHandler， 在 其 中 调用 孙 数 BSP_Interrupt_Handler 按 照 中 断 种 类 
进行 具体 处 理 ， 如 果 是 时 钟 中 断 ， 那 么 还 要 调用 函数 TickISR 以 清除 时 
钟 中 断 声 明 ， 同 时 设置 下 一 次 时 钟 中 断 的 发 生 时 刻 。 从 函数 


BSP_Interrupt_Handler 3% [El 到 InterruptHandler A , & iA ARR 2X 
OSIntExit， 如 果 全 局 变量 OSIntNesting 为 0， 且 有 更 高 优先 级 的 任务 处 
于 就 绪 态 ， 那 么 还 会 调用 函数 OSIntCtxSw 进 行 任务 切换 ， 反 之 ， 返 回 
到 函数 InterruptHandler， 恢 复 被 中 断 的 任务 继续 执行 。 上 述 就 是 中 断 
处 理 过 程 涉 及 到 的 主要 六 数 的 关系 。 


12. BA®XDisableInterruptSource 


本 函数 的 作用 是 通过 设置 Status 寄 存 器 中 IM 字 段 指定 位 为 0， 从 而 
禁止 指定 的 外 部 中 断 。 遂 数 声 明 如 下 。 


void DisableInterruptSource(CPU_INT32U int_source); 


国 数 代码 如 下 。 其 中 将 寄存 器 494 的 值 与 Compare 寄 存 器 相 与 ， 结 
果 再 保存 回 Compare 寄 存 器 ， 参 考 15.10.2 节 MIPS 卫 数 调用 的 参数 传递 
规范 可 知 ， 寄 存 器 $4 中 保存 的 就 是 传 入 的 参数 int_source。 


.ent DisableInterruptSource 


DisableInterruptSource: 


mfco $8, $12 /* 获取 Status 寄 存 器 的 值 */ 


and $8, $4 /* 与 传 入 的 参数 相 与 */ 

mtcO $8, $12 /* 结果 再 保存 回 Status 寄 存 器 */ 
jr $31 

nop 


.end DisableInterruptSource 


13. BX®XEnablelnterruptSource 


本 函数 的 作用 是 通过 设置 Status 寄 存 器 中 IM 字 段 指定 位 为 1， 从 而 
使 能 指定 的 外 部 中 断 。 阔 效 声 明 如 下 。 


void EnableInterruptSource(CPU_INT32U int_source); 


国 数 代码 如 下 。 其 中 将 寄存 器 $94 的 值 与 Compare 寄 存 器 相 或 ， 结 
果 再 保存 回 Compare 寄 存 器 ， 参 考 15.10.2 节 MIPS 函 数 调用 的 参数 传递 
规 东 可知， 寄存 器 $4 中 保存 的 就 是 传 入 的 参数 int_source。 


.ent DisableInterruptSource 


DisableInterruptSource: 


mfcO $8, $12 /* 获取 Status 寄 存 器 的 值 */ 

or $8, $4 /* 与 传 入 的 参数 相 或 */ 

mtco $8, $12 /* 结果 再 保存 回 Status 寄 存 器 */ 
jr $31 

nop 


.end DisableInterruptSource 


本 节 给 出 的 代码 位 于 本 书 附 带 光 盘 
Code\Chapterl5\ucosii_OpenMIPS\port 目 录 下 的 同名 文件 中 。 


15.11.4 ”修改 os_cpu_c.c 文 件 


移植 过 程 最 后 一 个 要 修改 的 文件 是 os_cpu_c.c， 从 后 缀 就 可 以 知道 
这 是 一 个 C 语 言 文 件 。 包 括 如 下 几 个 函 效 。 


e OSInitHookBegin 

e OSInitHookEnd 

e OSTaskCreateHook 

e OSTaskDelHook 

e OSTaskReturnHook 

e OSTaskIdleHook 

e OSTaskStatHook 

e OSTaskSwHook 

e OSTCBInitHook 

e OSTimeTickHook 

e OSTaskStklnit 

e BSP_Interrupt_Handler 
e BSP _Exception_Handler 


AH, REE A Hook EMITAN E NIF, KA 
REBAJAR E, BEIERTFEIEN, AHAB ER 
只 解释 最 后 三 个 函数 。 


1. BAOSTaskStkInit 


PK LOS TaskStkInit # PK FX OSTaskCreate 3 # HK ZX OSTaskCreateExt 
AB, FARMS CRIS CURES ATER. PPX FRAY Fo 


OS_ STK *OSTaskStkInit (void (*task)(void *pd), 
void *p_arg, 
OS_ STK *ptos, 
INT16U opt); 


从 中 可 以 发 现 有 四 个 参数 ， 分 别 如 下 。 

(1) task: 指向 任务 的 执行 代码 。 

(2) p_arg: 指向 用 户 提供 的 一 段 内 存 区 域 。 
(3) ptos: 指向 堆栈 顶部 。 

(4) opt: 一 些 特殊 选项 。 


国 数 OSTaskStkInit 的 返回 值 是 堆栈 栈 顶 地 址 。 本 函数 用 来 初始 化 
即将 创建 的 任务 的 堆栈 ， 而 nC/OS-II 中 新 创建 的 任务 处 于 就 绪 态 ， 其 
堆栈 结构 应 该 如 图 15-10 所 示 。 有 了 这 个 知识 ， 就 容易 理解 函数 
OSTaskStkInit 了 ， 其 代码 如 下 。 


OS_STK *OSTaskStkInit (void (*task)(void *pd), 
void *p arg, 
OS_STK *ptos, 
INT16U opt) 


INT32U *pstk; 
INT32U sr_val; 
INT32U gp_val; 


/* RAHFHRAEASHopt, REARS AS IAE RAMA ER */ 
(void)opt; 


/* Statusas, UMHS CE RARO.) Hie AyIM15.9 
节 所 述 */ 


asm volatile("mfco %0,$12" : "=r"(sr_val)); 


/* Status 寄 存 器 的 值 保存 在 变量 sr _val 中 ， 设 置 其 第 10 位 为 1， 设 置 其 第 0 位 


为 1，Sr_Vval 将 作为 新 任务 的 对 应 Status 寄 存 恬 的 值 ， 此 处 的 设置 就 是 使 得 
新 任 
务 在 执行 时 允许 时 钟 中 断 */ 
sr_val |= 0x00000401; 


/* 获取 当前 全 局 指针 寄存 器 gp 的 值 ， 也 就 是 寄存 器 %28 */ 
asm volatile("addi %0,$28,0" : "=r"(gp_val)); 


/* 设置 变量 pstk 为 传 入 的 参数 ptos 的 值 ， 即 堆栈 的 栈 顶 地 址 */ 
pstk = (INT32U *)ptos; 


/* HC/0S-II 的 堆栈 是 从 高 地 址 向 低地 址 生长 的 ， 下 面 的 代码 中 ，pstk 依 次 降 
低 ， 设 置 堆栈 
的 初始 值 ， 这 些 值 对 应 图 15-10 中 的 各 个 寄存 器 ， 其 中 大 部 分 寄存 器 的 初始 


值 都 可 以 任意 
设置 */ 

pstk--; 
*nstk-- = (INT32U)task; /* 整数 寄存 器 $31 */ 
*nstk-- = (INT32U)0x30303030; /* 整数 寄存 器 $30 */ 
Enstlke ss = oo val; /* 整数 寄存 器 $28 */ 
*pstk-- = (INT32U)0x27272727; /* 整数 寄存 器 $27 */ 
*nstk-- = (INT32U)0x26262626; /* 整数 寄存 器 $26 */ 
*pstk-- = (INT32U)0x25252525; /* 整数 寄存 器 $25 */ 


*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 
*pstk-- 


(INT32U)0x24242424; 
(INT32U)0x23232323; 
(INT32U)0x22222222; 
(INT32U)0x21212121; 
(INT32U)0x20202020; 
(INT32U)0x19191919; 
(1INT32U)0x18181818; 
(INT32U)0x17171717; 
(INT32U)0x16161616; 
(INT32U)0x15151515; 
(INT32U)0x14141414; 
(INT32U)0x13131313; 
(INT32U)0x12121212; 
(INT32U)0x11111111; 
(INT32U)0x10101010; 
(INT32U)0x09090909; 
(INT32U)0x08080808; 
(INT32U)0x07070707; 
(INT32U)0x06060606; 
(INT32U)0x05050505; 
(INT32U)0x04040404; 
(INT32U)0x03030303; 
(INT32U)0x02020202; 
(INT32U)0x01010101; 
(INT32U)0x00000000; 
(INT32U)0x00000000; 
(INT32U)task; 
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寄存 器 EPC */ 


tostkes = sr val; /* 寄存 器 SR */ 


return ((OS_STK *)pstk); /* 返回 值 就 堆栈 的 栈 顶 地 址 */ 


详细 注释 在 程序 中 已 经 给 出 ， 不 再 重复 说 明 ， 只 提醒 读者 注意 一 
点 ， 此 处 将 新 任务 的 入 口 地 址 task 存 放 到 堆栈 中 对 应 整数 寄存 器 $31 的 
位 置 ， 所 以 上 一 节 解 释 的 水 数 OSStartHighRdy 可 以 在 最 后 使 用 指令 jr 
$31 跳 转 到 新 创建 的 最 高 优先 级 的 任务 开始 执行 。 


2. PK@XBSP_Interrupt_Handler 


如 图 15-13 所 示 ， 中 断 发 生 后 ， 会 调用 本 上 子 效 进 行 具 体 的 中 断 处 
理 。 其 代码 如 下 。 


void BSP_Interrupt_Handler (void) 
{ 

INT32U cause_val; 

INT32U cause_reg; 


INT32U cause_ip; 


/* 读 取 Cause 寄 存 器 ， 获 得 其 中 的 IP (Interrupt Pending) FR */ 


asm ("mfcO %0,$13" : "=r"(cause_val)); 
cause_reg = cause_val; 
cause_ip = cause_reg amp; OxOOQOQOFFOO; 


if((cause_ip amp; 0x00000400) != © ) 
{ 


/* 如 果 IP 字 段 表 示 是 时 钟 中 断 ， 那 么 调用 遂 数 TickISR， 在 该 水 数 中 将 
Compare 寄 存 器 增加 96x50000， 同 时 清除 时 钟 中 断 声明 */ 
TickISR(0x50000) ; 


上 述 代 码 首先 获取 Cause 寄 存 器 的 耻 字 段 ， 据 此 可 以 了 解 中 断 类 
型 ， 然 后 分 别 进 行 处 理 。 此 处 只 对 时 钟 中 断 进 行 处 理 ， 读 者 朋友 可 以 
自行 添加 对 其 余 中 断 的 处 理 代 码 。 如 果 是 时 钟 中 断 ， 那 么 会 调用 函数 
TickISR ， 该 图 数 在 文件 os_cpu_a.S 中 已 经 解释 ， 作 用 是 修改 Compare 
寄存 器 的 值 ， 并 清除 时 钟 中 断 声明 。 此 处 将 Compare 寄 存 器 的 值 增 加 
0x50000。 这 样 下 一 次 时 钟 中 断 就 会 在 0x50000 个 时 钟 周 期 后 再 次 发 
生 ， 如 果 系 统 的 运行 频率 是 27MHz， 那 么 0x50000 个 时 钟 周 期 大 概 是 


12mso 
3. KŽBSP_Exception_Handler 


系统 调用 异常 、 无 效 指令 、 溢 出 异常 、 自 陷 异 常 等 异常 发 生 后 ， 
e 划 行 处 理 ， 后 者 会 调用 本 函数 处 理 各 种 具 


体 异常 。 代 码 如 下 。 


void BSP_Exception_Handler (void) 
{ 

INT32U cause_val; 

INT32U cause_exccode; 


INT32U EPC; 


/* 读 取 Cause 寄 存 器 ， 获 得 其 中 的 ExcCode 字 段 ， 该 字段 存储 的 是 异常 原因 


现在 ， 读 者 可 以 回顾 在 os_cpu.h 中 定义 的 一 个 宏 ， 如 下 。 


#define OS _TASK_SW() asm("\tsyscall\n"); 


如 上 所 示 的 宏 用 来 进行 任务 切换 ， 是 在 hC/OS-I 从 低 优先 级 任务 
切换 到 高 优先 级 任务 时 使 用 到 的 。 它 是 如 何 实现 任务 切换 的 呢 ? 在 这 
里 可 以 找到 答案 。 


从 定义 中 可 以 发 现 该 安定 义 实 际 就 是 系统 调用 指令 syscall， 该 指 
令 会 引起 系统 调用 异 单 。 从 国 数 BSP_Exception_Handler 的 代码 可 知 ， 
系统 调用 异常 的 处 理 过 程 会 调用 函数 OSIntCtxSw。 BKIXOSIntCtxSwiE 
文件 os_cpu_a.S 中 实现 ， 上 一 小 节 已 给 出 解释 说 明 ， 其 作用 就 是 进行 
任务 切换 。 由 此 ， 实 现 了 宏 OS_TASK_SW0 的 功能 。 


对 于 无 效 指令 、 溢 出 异常 、 自 陷 异 常 等 异常 情况 ， 并 没有 明确 如 
何 处 理 ， 读 者 可 以 依据 自己 的 需要 灵活 修改 ， 在 笔者 的 移植 过 程 中 ， 
只 进行 任务 切换 。 

本 节 给 出 的 代码 位 于 本 书 附带 光盘 中 


Code\Chapter15\ucosii_OpenMIPS\port 目 录 下 的 同名 文件 。 


上 述 通过 对 os_cpu.h、o0s_cpu_a.S、o0s_cpu_c.c 等 三 个 文件 的 修 
改 ， 实 现 了 移植 hC/OS-I 到 OpenMIPS 处 理 器 。 下 面 将 编写 测试 程序 
以 验证 hnC/OS-II 是 否 移植 成 功 。 


15.12 ”测试 程序 


本 节 将 编写 一 个 简单 的 测试 程序 ， 在 该 程序 中 ， 我 们 创建 了 一 个 
用 户 任 务 ， 该 任务 通过 UART 输 出 一 个 指定 字符 串 中 的 一 个 字符 ， 同 
时 通过 GPIO 输 出 一 个 数 〈 初 始 的 时 候 为 0) ， 然 后 延 时 大 概 100ms， 再 


输出 指定 字符 串 中 的 下 一 个 字符 ， 同 时 将 GPIO 的 输出 加 2。 为 实现 该 
测试 ， 需 要 创建 两 个 文件 openmips.h、openmips.c。 同 时 ， 修 改 include 
文件 夹 下 的 文件 includes.h， 在 其 中 引用 新 创建 的 文件 openmips.h， 如 
Fo 


#include <stdarg.h> 
#include <stddef.h> 
#include <limits.h> 


#include "ucos_ii.h" 


#include "openmips.h" // 增 加 Xjopenmips.h 文 件 的 3/ 用 


15.12.1 创建 openmips.h 文 件 


openmips.h 文 件 定 义 了 一 些 在 测试 程序 中 会 使 用 到 的 宏 定义 ， 主 
2AA UWRF. RNR AFM FA BH HK RR 
Code\Chapter15\ucosii_OpenMIPS\includeH R Fo 
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器 的 偏 移 地 址 */ 


#define 
地 址 */ 
#define 
7 
#define 
ned 


/* Line 
#define 


#define 


/* Line 
#define 
#define 
#define 
% 


/* 一 些 函 
extern void uart_init(void); 


extern void uart_putc(char); 


UART_LS_REG 0x00000005 /* Line Status 寄 存 器 的 偏 移 
UART_DLB1_REG 0x00000000 /* 分 频 系数 低 字 节 的 偏 移 地 址 
UART_DLB2_REG 0x00000001 /* 分 频 系 数 高 字 节 的 偏 移 地 址 


Status 寄 存 器 的 标志 位 */ 


UART_LS_TEMT 0x40 /* 第 6bit 为 发 送 数据 空 标志 */ 
UART_LS_THRE 0x20 /* 第 5bit 为 发 送 FIF0 空 标志 */ 


Control1 寄 存 器 的 标志 位 */ 

UART_LC_NO_PARITY 0x00 /* 第 3bit 为 09， 表示 禁止 奇偶 校 验 */ 
0x00 /* 第 2bit 为 0， 表 示 1 位 停止 位 */ 
0x03 /* 最 低 两 位 为 11， 表 示 数 据 长 度 是 8 位 


UART_LC_ONE_STOP 
UART_LC_WLEN8 


数 声明 */ 
/* UART 控 制 器 初始 化 函数 */ 
/* UART 控 制 器 输出 字 节 国 数 */ 


extern void uart_print_str(char*); /* UART 控 制 器 输出 字符 串 函 数 */ 
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第 四 段 : 与 GPI0 模 块 有 关 的 宏 
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上 述 代码 可 以 分 为 五 段 理解 。 


第 一 段 : 定义 了 三 种 加 载 、 存 储 的 宏 ， 分 别 是 : FR. FF, 
字 。 通 过 如 下 实例 说 明 其 用 法 。 


result = REG8(addr); // 加 载 地 址 addr 处 的 字 节 

result = REG16(addr);  ”// 加 载 地 址 addr 处 的 半 字 

result = REG32(addr);  ”// 加 载 地 址 addr 处 的 字 

REG8 (addr) = QxFF; // 将 字 节 0xFF 存 储 到 地 址 addr 处 
REG16(addr) = OXxFFFF; // 将 半 字 9xFFFF 存 储 到 地 址 addr 处 
REG32(addr) = OXFFFEFFFF; // 将 字 0xFFFFFFFF 存 储 到 地 址 addr 处 


第 二 段 : 定义 了 系统 时 钟 ， 我 们 的 最 小 SOPC 运 行 在 DE2 平 台 上 ， 
使 用 的 是 27MHz 的 时 钟 ， 所 以 此 处 设置 为 27000000。 


第 三 段 : 定义 了 与 UART 控 制 器 有 关 的 宏 ， 包 括 : UART 控 制 器 的 
起 始 地 址 ， 因 为 在 小 型 SOPC 中 ，UART 控 制 器 挂 在 WB_CONMAX 的 
从 设备 接口 1， 所 以 其 地 址 空间 从 0x10000000 开 始 ; 还 定义 了 UARTI 控 
制 器 中 各 个 寄存 器 的 地 址 相对 起 始 地 址 的 偏 移 ， 还 定义 了 UART 控 制 
器 的 传输 速率 ， 此 处 设置 为 9600bps。 另 外 ， 还 有 一 些 标志 位 ， 读 者 可 
以 参考 13.4.2 节 理解 ， 在 文件 openmips.c 使 用 这 些 标 志 位 的 时 候 会 更 加 


清楚 其 含义 。 


SOR: 定义 了 与 GPIO 模 块 有 关 的 宏 ， 包括 : GPIO 模 块 的 起 始 
地 址 ， 因 为 在 小 型 SOPC 中 ，GPIO 模 块 挂 在 WB_CONMAX 的 从 设备 接 
口 2， 所 以 其 地 址 空间 从 0x20000000 开 始 ; 还 定义 了 GPIO 模 块 中 各 个 
麻 存 器 的 地 址 相对 起 始 地 址 的 偏 移 。 


SAR: 主 函 数 main 声 明 。 


15.12.2 ”创建 openmips.c 文 件 


openmips.c 文 件 实现 了 用 户 任 务 ， 该 任务 通过 UART 输 出 一 个 指定 
字符 串 中 的 一 个 字符 ， 同 时 通过 GPIO 输 出 一 个 数 (初始 的 时 候 为 
0) ， 然 后 延 时 大 概 100ms， 再 输出 指定 字符 串 中 的 下 一 个 字符 ， 同 时 
将 GPIO 的 输出 加 2。 主 要 代码 如 下 ， 源 文件 位 于 本 书 附带 光盘 中 
Code\Chapter15\ucosii_OpenMIPS\common 目 录 下 。 
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* = 
#include "includes.h" 
#define BOTH_EMPTY (UART_LS_TEMT | UART_LS_THRE) 


/* 循环 等 待 ， 直 到 UART 控 制 器 的 发 送 FIF0 为 空 、 移 位 寄存 器 为 空 ， 表 示 数 据 发 送 完 
EE ey 
#define 


WAIT_FOR_XMITR \ 


上 述 实现 用 户 任务 的 代码 比较 长 ， 但 是 结构 还 是 很 清晰 的 ， 可 以 
分 为 六 段 ， 其 中 前 四 段 是 一 些 宏 、 变 量 的 定义 ， 以 及 与 UART 控 制 
器 、GPIO 模 块 有 天 的 一 些 函 数 定义 ， 第 五 段 定 义 了 用 户 任务 ， 第 六 段 
是 主 钞 数 ， 在 其 中 创建 用 己任 务 、 局 动 hC/OS-II。 下 面 分 别 介绍 


BR: 定义 了 一 些 宏 、 变 量 ， 如 下 。 


(1) 与 UART 控 制 器 有 关 的 宏 WAIT_FOR_XMITR 、 
WAIT_FOR_THRE。UART 控 制 器 在 发 这 数据 时 ， 先 将 要 发 这 数据 写 
入 发 送 FIFO， 然 后 通过 移 位 寄存 器 依次 发 送 。 宏 WAIT_FOR_XMITR 
用 来 等 待 数据 发 送 完毕 ， 要 求 发 送 FHIFO、 移 位 寄存 器 都 为 空 
El; 安 WAIT_FOR_THRE 仅 等 待 到 发 送 FIFO 为 空 就 返回 。 


以 WAIT_FOR_THRE 为 例 解释 ， 在 这 个 宏 中 ， 不 断 读 取 UART 控 
制 器 的 Line Status $ 72 (UART_BASE + UART_LS_REG 的 和 就 是 
Line Status 寄 存 器 的 地 址 ) ， 判 断 其 发 送 FIFO 空 标志 是 否 为 1 (通过 lsr 
amp; UART_LS_THRE 是 否 等 于 UART LS_THRE 判断 ， 其 中 ， 
UART LS_THRE 的 值 为 0x20， 而 发 送 FIFO 空 标志 正 是 lsr 的 第 5bit) o 
如 果 不 为 1， 那 么 再 次 读 取 Line Status 寄 存 器 的 值 ， 继 续 判 断 ， 直 到 发 
送 FIFO 空 标志 为 1， 然 后 返回 。 


(2) 定义 了 任务 使 用 的 堆栈 TaskStartStk， 大 小 是 256 个 字 。 


(3) 定义 了 要 通过 UART 输 出 的 字符 串 Imnfo， 这 个 字符 串 是 如 下 
文字 的 十 六 进 制 编码 ， 每 个 汉字 使 用 两 个 字 节 表示 ， 所 以 在 后 面 通过 
UARI 发 送 的 时 候 ， 需 要 每 次 发 送 两 个 字 节 。 在 mmfo 的 最 后 增加 了 一 
回 车 符 0x0D。 


第 二 段 : EXT SUARTH RAMANA, BIEUARTH fil 28 
初始 化 函数 、 输 出 字 节 函数 、 输 出 字符 串 函 数 。 


(1) UARIT 控 制 器 初始 化 函数 uart_init: 该 函数 与 14.6.2 节 测试 程 
序 中 的 UART 控 制 器 初始 化 过 程 基本 一 样 ， 只 是 后 者 是 使 用 汇编 编 
写 ， 而 此 处 是 使 用 C 语 言 编写 。 首 先 按照 UART 控 制 器 规定 的 公式 计算 
分 频 系数 。 然 后 设置 Line Control 寄 存 器 的 最 高 位 为 1， 此 时 就 可 以 访 
问 分 频 系数 寄存 器 了 ， 进 而 设置 两 个 分 频 系数 寄存 器 。 设 置 完 成 后 ， 
再 将 Line Control 寄 存 器 的 最 高 位 改 为 0。 然 后 设置 数据 格式 ， 此 处 还 
是 8 位 数据 位 、1 位 停止 位 、 没 有 奇偶 校 验 位 。 最 后 ， 调 用 函数 
uart_print_str 输 出 UART 控 制 器 初始 化 完毕 信息 “UART initialize done 


„ 
r 


(2) UART#IM FT RI Buart_putc: AAA A FCHETUARTEIR 
送 FIFO 是 否 为 空 ， 如 果 为 空 ， 那 么 可 以 发 送 数据 。 向 UARIT 控 制 器 的 
Transmitting Holding Register 写 入 要 发 送 的 数据 ， 然 后 调用 安 
WAIT_FOR_XMITR 以 等 竺 发送 完毕 。 如 果 要 发 送 的 数据 是 换行 符 ， 
那么 需要 再 通过 UART 发 送 一 个 回 车 符 。 


(3) UARTHIWS4 Bek Nuart_print_str! 通过 调用 函数 uart_putc 
依次 发 送 要 发 送 字符 串 中 的 每 个 字 节 即 可 。 
第 三 段 : 定义 了 与 GPIO 模 块 有 关 的 函数 。 包 括 GPIO 模 块 初始 化 
国 数 、GPIO 输 出 儿 数 、 读 取 GPIO 输 入 的 函数 。 


(1) GPIO 模 块 初始 化 函数 gpio_init: 该 函数 使 能 GPIO 模 块 的 所 
有 输出 端口 ， 禁 止 GPIO 模 块 的 所 有 中 断 ， 然 后 设置 GPIO 的 输出 为 


0x0f0f0f0f ， 表 示 GPIO 模 块 初 始 化 完毕 ， 最 后 ， 通 过 UART 输 出 GPIO 
模块 初始 化 完毕 信息 “GPIO initialize done !”o 


(2) GPIO 输 出 函数 gpio_out: 直接 将 输出 值 赋 给 GPIO 模 块 的 输 
出 寄存 器 RGPIO_OUT 即 可 。 


(3) 读 取 GPIO 输 入 的 函数 gpio_in: 直接 读 取 GPIO 模 块 的 输入 寄 
存 器 RGPIO_IN 即 可 。 


第 四 段 : 定义 了 定时 器 初始 化 函数 OSInitTick。hC/OS-I 在 每 个 时 
钟 节拍 Tick 发 生 一 次 中 断 ， 而 每 秒 发 生 Tick 的 次 数 等 于 宏 
OS_TICKS_PER_SEC， 这 个 宏 是 在 文件 os_cfg.h 中 定义 的 ， 默 认 是 
100， 也 就 是 每 秒 发 生 100 次 Tick， 每 两 次 Tick 相 隔 10ms， 由 此 就 可 以 
设置 Compare 寄 存 器 的 初始 值 ， 通 过 如 下 式 子 计算 。 


系统 时 钟 频率 /OS_TICKS_PER_SEC 


在 图 数 OSInitTick 中 ， 就 把 通过 上 式 计 算得 到 的 值 设置 为 Compare 
寄存 器 的 初始 值 。 除 此 之 外 ， 还 设置 Count 寄 存 器 为 0， 因 为 系统 加 电 
后 ，Count 寄 存 器 的 值 就 一 直 在 递增 ， 所 以 此 处 将 其 清 零 ， 以 重新 开始 
计数 。 最 后 ， 设 置 Status 寄 存 器 的 值 ， 使 能 时 钟 中 断 。 


BAR: 定义 了 用 户 任务 TaskStart。 在 15.5.5 节 介绍 过 : hC/OS-II 
先 调 用 系统 初始 化 函数 OSInit， 再 调用 系统 启动 图 数 O0SStart， 在 调用 
OSStart 之 后 做 的 第 一 件 事 就 是 允许 时 钟 节拍 中 断 。 实 际 上 ， 一 般 将 允 
许 时 钟 节拍 中 断 的 过 程 放 在 第 一 个 任务 中 。 所 以 用 户 任务 TaskStart 首 
先 调用 之 前 定义 的 定时 器 初始 化 函数 OSInitTick ， 在 其 中 使 能 时 钟 中 
Efo 


然后 输出 Info 字 符 串 中 的 两 个 字 节 〈 对 应 一 个 汉字 ) 。 设 置 GPIO 
模块 的 输出 为 count 的 值 。 将 count 加 2， 等 待 10 个 Tick， 大 约 是 100ms， 
再 输出 Info 中 的 下 一 个 汉字 ， 同 时 更 新 GPIO 的 输出 值 。 读 者 需要 注意 
一 点 ; 在 我 们 上 一 章 建立 的 SOPC 上 运行 该 任务 时 ，4 个 7 段 数码 管 并 不 
是 直观 显示 count 的 值 ， 比 如 : count 的 值 为 0x00000002，GPIO 模 块 的 
输出 也 为 0x00000002， 但 是 4 个 7 段 数码 管 上 的 显示 并 不 是 直观 的 
0x00000002， 而 是 如 图 15-14 所 示 ， 读 者 可 以 参考 图 14-13 给 出 的 7 段 数 
码 管 的 引 脚 与 数码 管 的 对 应 关系 进行 理解 。 


i 
O co 


图 15-14 _ count 等 于 0x00000002 时 的 数码 管 显示 


SAR: 主 函 数 ， 这 是 hC/OS-I[ 中 标准 的 主 了 图 数 ， 首 先 调用 操作 
系统 初始 化 函数 OSInit， 然 后 调用 各 种 硬件 设备 的 初始 化 函数 ， 包 括 
UARI 控 制 器 的 初始 化 函数 、GPIO 模 块 的 初始 化 函数 ， 接 着 调用 函数 
OSTaskCreate 创 建 一 个 用 户 任务 ， 创 建 的 任务 就 是 第 五 段 定义 的 
TaskStart， 最 后 ， 调 用 函数 OSStart， 启 动 hC/OS-II。 


15.13 ”编译 指示 文件 的 建立 


经 过 15.11、15.12 两 节 的 工作 ， 我 们 已 经 移植 hC/OS-I 到 
OpenMIPS 处 理 器 ， 并 且 编 号 了 测试 程序 ， 现 在 可 以 建立 编译 指示 文件 
了 ， 最 终 目 的 是 通过 一 条 简单 的 make al 命令 可 以 编译 所 有 的 代码 ， 得 
到 hC/OS-I 的 二 进 制 文 件 。 


1. 新 建 链接 脚本 文件 ram.Id 


链接 脚本 文件 ram.ld 放 在 ucosii_ OpenMIPS 目 录 下 。 主 要 内 容 如 


下 。 


} > ram 


在 其 中 定义 了 很 多 的 Section， 这 些 都 是 在 编译 的 时 候 会 生成 的 
Section。 此 外 ， 单 独 声明 一 个 vectors Section， 占 用 低 0x80 字 节 的 空 
间 ， 用 来 存放 异常 处 理 例 程 入 口 地 址 ， 其 余 的 可 执行 程序 放 在 地 址 
0x80 以 上 的 空间 。 


ram.1]d 的 最 后 定义 了 变量 _stack_addr， 其 值 等 于 堆栈 的 栈 顶 地 址 。 
该 变量 在 15.11.3 节 介绍 的 文件 os_cpu_a.S 中 的 复位 异常 处 理 例 程 入 口 
处 的 代码 中 使 用 到 。 


2. 新 建 config.mk、Makefile 文 件 


这 两 个 文件 都 放 在 ucosii_OpenMIPS 目 录 下 。 文 件 config.mk 的 内 容 
如 下 ， 其 中 定义 了 一 些 变量 ， 这 些 变量 对 Makefile 文 件 是 有 用 的 ， 包 
括 : 编译 参数 CFLAGS、 汇 编 参 数 ASFLAGS、 链接 参数 LDFLAGS。 
注意 在 CFLAGS 的 定义 中 有 “-mips32” 选 项 ， 表 示 要 求 编译 器 按照 
MIPS32 指 令 集 架构 (Release 1) 编译 源 程 序 。 


HHHHHHAHHHAAHHHAAHHEAAHHEAHHHEAHHHHAHHEEAAHHHEAHEHAAHEHAAHE EAA 
HHHHHHHHHH 


CONFIG_SHELL := $(shell if [ -x "$$BASH" ]; then echo $$BASH; \ 
else if [ -x /bin/bash ]; then echo 
/bin/bash; \ 


else echo sh; fi ; fi) 


文件 Makefile 的 内 容 如 下 ， 也 是 位 于 ucosii OpenMIPS 目 录 下 。 


-print | xargs rm -f 
rm -f $(0BJS) *.bak tags TAGS 


BM aie, sae 


HHHHHHAHHHAAHHEAAHHHAAHHEAHHHEAHHHHAHHHEAAHHHEAHHHAAHEHAAHEAA 
HHHHHAAHHE 


最 后 编译 得 到 的 hC/OS-I 的 二 进 制 文件 是 ucosii.bin， 但 是 此 处 增 
加 了 一 步 ， 使 用 程序 MergeBin.exe 将 ucosii.bin 与 BootLoaderbin 按 照 
14-24 所 示 的 格式 合并 成 一 个 二 进 制 文件 OS.bin。 这 样 只 需要 将 OS.bin 
写 入 DE2 板 上 的 Flash， 当 OpenMIPS 运 行 时 ， 会 首先 运行 BootLoader， 
后 者 将 hC/OS-I[ 的 代码 复制 到 SDRAM 中 ， 然 后 跳 转 到 SDRAM， 把 控 
制 权 交 给 hC/OS-I， 于 是 hC/OS-I 就 运行 起 来 了 。 


从 上 面 的 Makefile 还 可 以 发 现 ， 需 要 在 各 个 子 目 录 下 生成 对 应 的 
LIB 库 文件 ， 比 如 : common 目 录 下 要 有 LIB 文 件 common.o，ucos 目 录 
下 要 有 LIB 文 件 ucos.o、port 目 录 下 要 有 LIB 文 件 porto， 这 些 都 需要 在 
各 个 子 目 录 下 编写 Makefile 文 件 。 


3. 在 Common 目 录 下 添加 Makefile 文 件 


其 内 容 如 下 。LIB 文 件 定 义 为 common.o。 


# CFLAGS += -DET_DEBUG -DDEBUG 
LIB = common.o 


OBJS = openmips.o 


4. 在 ucos 目 录 下 添加 Makefile 文 件 


内 容 如 下 。 注 意 在 其 中 的 OBJS 添 加 ucos 目 录 下 所 有 的 C 文 件 。LIB 
文件 定义 为 ucos.o。 


5。 在 port 目 录 下 添加 Makefile 文 件 


内 容 如 下 。 注 意 在 其 中 的 OBJS 添 加 port 目 录 下 的 C 文 件 ，SOBJS 添 
加 port 目 录 下 的 汇编 文件 。LIB 文 件 定义 为 port.o。 


$(LIB): $(OBJS) $(SOBJS) 
$(LD) -r -o $0 $(0BJS) $(SOBJS) 


HHHHHHAHHHAAHHHAAHHEAAHHEAHHEEAHHEEAHHHEAAHHHAAHHHAAHEHAAHEEAA 
HHHHHHHHHH 


. depend: Makefile $(OBJS:.o=.c) $(SOBJS:.o=.S) 
$(CC) -M $(CFLAGS) $(OBJS:.o=.c) $(SOBJS:.o=.S) 
> $@ 


Sinclude .depend 


HHHHHHAHHHEAHHHAAHHHAAHHEAHHEEAHHHEAHHHEAAHHHEAHHHAAHEHAAHEHAAH 
HHHHHHAHHE 


上 述 文 件 建立 后 ， 整 个 JC/OS-II 的 文件 目录 就 完善 了 ， 如 图 15-15 
所 示 。 其 中 加 粗 冬 体 的 文件 都 是 新 增加 的 文件 。 


在 Ubuntu 虚 拟 机 中 ， 打 开 终 端 ， 调 整 到 jC/OS-II[ 工 程 目录 
ucosii OpenMIPS， 输 入 make al， 即 可 得 到 最 终 的 二 进 制 文件 
OS.bin， 该 文件 可 以 直接 写 入 DE2 上 的 Flash。 


ucosii_OpenMIPS 


o> 


Makefile 
config.mk 
ram.ld 
BootLoader.bin 
BinMerge.exe 


he 


ucos 包含 kC/OS-T 源 代码 的 大 部 分 文件 


os_core.c 
os_dbg r.c 
os_flag.c 
os_mbox.c 
os_mem.c 
os_mutex.c 
» OS q.c 

0S_sem.c 
os_task.c 
os_time.c 
os_tmr.c 
ucos_ii.c 


Makefile 


port 41 含 与 具体 处 理 器 有 关 的 源 代 码 文 件 


os_cpu_a.S 
» 0s cpu c.c 
Makefile 


Tay 


app_cfg.h 
cpu.h 
includes.h 
os_cfg.h 

os _cpu.h 
ucos_ii.h 
Makefile 
openmips.h 


> 


e 


common 包含 用 户 程序 


| p> openmips.c 


图 15-15 pC/OS-II 移 植 工程 的 整个 文件 目录 


15.14 ”OpenMIPS 处 理 器 运行 移植 
后 的 nC/OS-II 


按照 第 14 章 介绍 的 步骤 将 文件 OS.bin 写 入 DE2 开 发 平台 上 的 
Flash， 打 开 PC 上 的 串口 程序 ， 将 参数 设置 为 与 小 型 SOPC 的 一 样 ， 即 
设置 波 特 率 为 9600bps、8 位 数据 位 、 没 有 奇偶 校 验 位 、1 位 停止 位 。 通 
过 拨 动 开关 SW17 复 位 OpenMIPS， 然 后 启动 OpenMIPS， 串 口 程 序 会 得 
到 如 图 15-16 所 示 的 结果 ， 其 中 的 汉字 大 概 每 隔 100ms 显 示 一 个 ， 另 
外 ，4 个 7 段 数 码 管 的 显示 大 概 每 隔 100ms 变 化 一 次 。 由 此 可 知 ， 
BootLoader 加 载 hC/OS-II[ 成 功 ，hC/OS-II 工 作 正 常 、 移 植 成 功 。 


读者 注意 一 点 ， 图 中 显示 的 字符 格式 与 预期 的 并 不 一 样 ， 有 些 地 
方 没 有 换行 ， 这 与 串口 程序 有 一 定 关 系 ， 笔 者 使 用 超级 终端 的 时 候 就 
显示 正常 。 


一 Sr x 
通讯 设置 PPP TAREA Q 


a 
串口 号 Loading 05 into SDRAM... 


波 特 率 “LLoad OS into SDRAM DONE!!! 


校 验 位 
数据 位 GPIO initialize done | 


VART initialize done ! 


停止 位 上 帝 说 要 有 光 ， 于 是 就 有 了 光 


上 帝 说 要 有 天 空 ， 于 是 就 有 了 天 空 上 帝 说 要 有 陆地 和 海洋 ， 于 是 就 有 了 陆地 和 


海洋 
接收 区 设置 
厂 接收 转向 交 件 ... 
厂 自动 换行 显示 
厂 十 六 进 制 显示 
厂 暂停 接收 显示 
发 送 区 设置 
厂 自用 文件 数据 源 ... 
厂 自动 发 送 附 加 位 
厂 发 送 完 自动 清空 
三 按 十 六 进 制 发 送 
厂 数据 流 循环 发 送 


发 送 间 隔 [1000 毫秒 
| 


LE 按 CtrltEnter 发 送 接收 : 5207 复位 计数 ó 


图 15-16 ”pC/OS-II 运 行 结 果 


15.15 ”本 章 小 结 


这 是 本 书 的 最 后 一 章 ， 也 是 本 书 最 长 的 一 章 ， 其 中 介绍 了 hC/OS- 
II 的 基本 情况 、 特 点 、 功 能 等 ， 然 后 通过 修改 代码 ， 移 植 hC/OS-II 到 
OpenMIPS 处 理 器 ， 并 且 编 写 测 试 程 序 、 建 立 编译 指示 文件 ， 得 到 可 以 
在 OpenMIPS 处 理 器 上 运行 的 uC/OS-II 二 进 制 文 件 。 最 后 通过 DE2 提 供 
的 环境 ， 在 OpenMIPS 处 理 器 上 实际 运行 HC/OS-I， 经 过 测试 ，hC/OS- 
II 运 行 正常 ， 说 明 我 们 移植 工作 的 正确 性 。 本 章 内 容 涉及 的 知识 比较 
多 ， 既 有 操作 系统 ， 又 有 MIPS 函 数 调用 规范 ， 还 有 一 些 与 编译 有 关 的 


知识 ， 并 且 同 时 使 用 了 汇编 和 C 语 言 进 行程 序 设 计 ， 读 者 理解 起 来 可 
能 有 一 定 难度 ， 需 仔细 体会 。 


附录 A ”教学 版 OpenMIPS 各 个 模 
块 的 接口 说 明 


A.1 PC 模块 接口 说 明 


PC 模块 接口 如 图 A-1 所 示 ， 米 用 左边 是 输入 接口 ， 右 边 是 输出 接 
口 的 方式 绘制 ， 目 的 是 便于 理解 ， 附 录 人 A 中 其 余 模块 的 接口 图 也 都 是 
采用 这 种 方法 绘制 ， 后 面 不 再 重复 说 明 。 各 接口 的 描述 如 表 A-1 所 
To 

PC 

stall 
flush 
new_pc 
branch flag i 
branch target address 1 
rst 


clk 


pc_reg.v 
图 A-1 PC 模块 的 外 部 接口 


表 A-1 PC 模块 的 接口 描述 


输入 /输出 
MA 复位 信号 
时 钟 信号 


转移 到 的 
流水 线 清除 信和 号 

new_pc 32 输入 异常 处 理 例 程 入 口 地 址 
stall 险 入 取 指 地 址 PC 是 否 保持 不 变 
mh 要 读 取 的 指令 地 址 

AN 指令 存储 器 ROM 使 能 信号 


A.2 IF/ID 模 块 接口 说 阴 


IF/ID 模 块 接口 如 图 A-2 所 示 ， 各 接口 的 描述 如 表 A-2 所 示 。 


表 A-2 ”IF/ID 模 块 的 接口 描述 


; 
阶段 取出 的 指令 对 应 的 地 址 
ion 
HUT at 
E 译 码 阶段 的 指令 对 应 的 地 址 


A.3 iD 模块 接口 说 明 


ID 模块 接口 如 图 A-3 所 示 ， 各 接口 的 描述 如 表 A-3 所 示 。 


图 A-2 


IF/ID 


stall 

flush 

if_pe id_pc 
if inst id inst 
rst 


clk 


if id.v 


IF/ID 模 块 的 外 部 接口 


ID 


pe_i 

inst_i 
ex_aluop 1 
ex_wreg_i 
ex wd i 
ex_wdata_i 
mem wd i 
mem wreg i 


mem wdata 1 


rst 


regl_data 1 


reg2 data 1 


is_in_delayslot_i 


aluop_o 

alusel_o 

regl_o 

reg2_0 

wd_o 

Wreg_0 

excepttype_o 

inst_o 
current_inst_address_o 
is_in_delayslot_o 
link_addr_o 
next_inst_in_delayslot_o 
regl read_o 
regl_addr_o 

reg2 read_o 

reg2 addr_o 

stallreq 

branch_flag_o 


branch_target_address_o 


id.v 


BIA-3 ”了 D 模 块 的 外 部 接口 


表 A-3 ID 模块 的 接口 描述 


泽 码 阶段 的 指令 对 应 的 地 志 


he reg? data i \ Regfile 输入 的 第 二 个 恋 寄 存 器 端口 的 输入 
fa CT 处 于 执行 险 段 的 指令 是 否 要 写 目 的 寄存 器 
上 处 于 执行 阶段 的 指令 要 写 的 自 的 寄存 器 地 址 
| | 处 于 执行 阶段 的 指令 要 写 入 日 的 寄存 器 的 数据 
— | | 处 于 访 存 阶段 的 指令 是 否 要 写 目 的 寄存 器 
Sa 处 于 访 存 阶段 的 指令 要 写 的 目的 寄存 器 地 吉 
nm i 32 fa | 小 于 访 存 阶段 的 指令 更 写 入 目的 寄存 器 的 数据 

a Tea CC 处 于 执行 阶段 指令 的 运算 子 类 型 

laa lis imdetaystori |i [iA | 当前 处 于 译 码 阶段 的 指令 是 否 位 于 延迟 槽 
eadte [1 | 输出 |Regfile 模块 的 第 一 个 读 宕 在 器 端口 的 读 使 能 信 入 
las | reg2 read o o fiam | Regfile KAMEN NEE 


lis | regl addr o ze Regfile REIRI AERE TT I ES: fa 


reg? addr o 输出 Reefile 模块 的 第 二 个 访客 在 器 端口 的 读 地 址 信号 


aluop o Sort EBRO E ie Sy PRA 

译 公 阶段 的 指令 要 进行 的 运算 的 类 型 

译 人 码 阶 段 的 指令 要 进行 的 运算 的 源 灌 作 数 1 

泽 公 阶段 的 指令 要 进行 的 运算 的 源 操作 数 2 

输出 详 但 阶段 的 指令 要 写 入 的 目的 寄存 器 地 所 

ESOO CE OC FR GT ETA IATE 
branch target address o 转移 到 的 目 慰 地 址 
EE 5 SA F PERSI PENITE Se fer Far 
CO O A 1 转移 指令 要 保存 的 返回 地 直 
|28 [next inst in delaysioro |i | 输出 | 下 一 条 进入 译 码 阶 段 的 指令 是 否 位 于 延迟 机 
Em ee E CUE a 
me er ETT 


A.A panpa 


Regfile 模 块 接口 如 图 A-4 所 示 ， 各 接口 的 描述 如 表 A-4 所 示 。 


表 A-4 ”Regfile 模 块 的 接口 描述 


q AA AA A 


1 rst re 复位 信号 ， 高 电 平 有 效 
2 clk 输入 时 钟 信号 
要 写 入 的 寄存 器 地 址 
ce TE 要 写 入 的 数据 


i 第 一 个 读 寄 存 器 端口 要 读 取 的 寄存 器 的 地 址 
fi 第 一 个 读 寄存 器 端口 读 使 能 信号 
te 第 一 个 读 寄存 器 端口 输出 的 寄存 器 值 
raddr2 第 二 个 读 寄存 器 端口 要 读 取 的 寄存 器 的 地 址 
re2 i 第 二 个 读 寄 存 器 端口 读 使 能 信和 号 
11 rdata2 32 M 第 二 个 读 寄 存 器 端 


AS ”ID/EX 模 块 接口 说 明 


ID/EX 模 块 接口 如 图 A-5 所 示 ， 各 接口 的 描述 如 表 A-5 所 示 。 


ID/EX 
stall ex_aluop 
flush ex_alusel 
id_aluop ex_regl 
id_alusel ex reg? 
id_regl ex_wd 
id_reg2 ex_wreg 
id_wd ex_excepttype 
id_wreg ex_link_address 
id_excepttype ex_inst 
id_inst ex_is_in_delayslot 


id_current_inst_address 
id is in delayslot ex_current_inst_address 
id_link_address 


next_inst_in_delayslot_i 


rst is in delayslot_o 


clk 


id_ex.v 


Regfile 


rel 
raddrl 
Te2 
raddr2 


waddr 


rdatal 


rdata2 


regfile.v 


图 A-4 ”Regfile 模 块 的 外 部 接口 


图 A-5 


ID/EX 模 块 的 外 部 接口 


RAS ”ID/EX 模 块 的 接口 描述 


id_aluop 


3 

8 
id regl 32 

32 输入 

s 


N 
mA 
hgs 
输 


入 


ex_inst 输出 


ma | if 


复位 信号 
时 钟 信和 号 
J 指令 要 进行 的 运算 


的 指令 要 进行 的 运算 


Saas 
指令 是 否 有 要 写 入 


译 码 阶段 指令 的 地 划 

SEQ TS HE FF 

发 的 转移 指令 要 保 
条 进入 译 码 阶段 的 指令 是 

当前 处 于 译 码 阶段 的 指令 


当前 处 于 执行 阶段 的 指令 


DES! 


的 子 类 型 


寄存 器 地 所 


DAEs Ohom earns 


Y PREIS AM 
存 的 返回 地 二 


否 位 于 延迟 村 


ex_is in delayslot 32 输出 


a few | 


当前 处 于 执行 阶段 的 指令 是 否 
的 转移 指令 要 保 


阶段 的 指令 是 否 


的 指令 要 进行 的 运算 


的 指令 要 写 入 的 目的 


站 段 的 指令 是 否 有 要 写 入 


A6 EX 模块 接口 说 明 


EX 模块 接口 如 图 A-6 所 示 ， 各 接口 的 描述 如 表 A-6 所 示 。 


位 于 延 退 展 
存 的 返回 地 址 


ee 


ETF cee Sl bl 
的 目的 寄存 器 


EX 


aluop_i 
alusel_i 
regl_i cpO_ reg We oO 
reg2_i cpO_reg_ write_addr_o 
wd_i cpO_ reg data_o 
wreg_i mem_addr_o 


excepttype_i 


link address_i reg2 o 
inst_i hi_o 
is_in_delayslot_i lo_o 
current_inst_address_i whilo_o 
hi_i hilo_temp_o 
lo_i cnt_o 
cpO_reg data i excepttype_o 
wb hi i is_in_delayslot_o 
wb_lo_i current_inst_address_o 
wb_whilo_i aluop_o 
wb_cpO_reg we wreg _ o 
wb_cp0_reg_write_addr wd_o 
wb_cp0_reg_data wdata_o 


mem_hi_i 
mem_lo i stallreq 
mem whilo i cpO_reg read_addr_o 


mem_cpO_reg we 


mem_cpO_reg write addr signed div_o 
mem_cpO_reg data div_opdatal_o 
hilo_temp_i div_opdata2_o 
ent_i div_start_o 


div_result_i 
div_ready_i 


rst 


exv 


图 A-6 EX 模块 的 外 部 接口 


表 A-6 ”EX 模块 的 接口 描述 


a 
wa 
A 


宽度 输入 / 
(bit) 
alusel i 


aluop i 输入 


regl i 


reg2 i 
wd i iT $F 令 执行 要 写 入 的 目的 寄存 器 地 址 


wreg i \ FEAT AT BES AY A MAET 


=m | th It 
t 


excepttype i 5 全 详 码 阶段 收集 到 的 异常 信息 


current inst addr i 2 ) HABER iy Ni hh 


is in delayslot i 当前 处 于 执行 阶段 的 指令 是 否 位 于 延迟 彬 
link_address i 32 处 于 执行 阶段 的 转移 指令 要 保存 的 返回 地 址 
hilo temp i 64 第 一 个 执行 周期 得 到 的 乘法 结果 
cnt i fi 当前 处 于 执行 阶段 的 第 儿 个 时 钟 周期 
hilo_temp_o A 第 一 个 执行 周期 得 到 的 乘法 结果 

FF 一 个 时 钟 周期 处 于 执行 阶段 的 第 儿 个 时 
钟 周期 


ent_o 


excepttype_o 32 i PEE. HUIT ER BOS SIAI Fe aE VT A 
current inst addr o 32 i 执行 阶段 指令 的 地 所 
is in delayslot_o 执行 阶段 的 指令 是 否 是 延迟 梢 指令 

执行 阶段 的 指令 最 终 要 写 入 的 日 的 寄存 器 
ikh 

执行 阶段 的 指令 最 终 是 否 有 要 写 入 的 目的 
AAT at 


输出 执行 阶段 的 指令 最 终 要 写 入 目的 寄存 器 玖 值 


wd o 


wreg 0 


13 
N 


wdata_o 


signed div_o 


as 


» ee ee ID 
-ID 


ta 
N 


div_opdatal_o 


us 
N 


div_ opdata2 o 
div_start_o 
div_result_i 


div_ready_i 


E. 
a 
Y 


a 
> 
a = a F 
六 


HILO 模块 给 出 的 HU 寄存 器 的 什 
loi 输入 HILO 模块 给 出 的 LO 寄存 器 的 值 


mem whilo i 输入 处 于 访 存 阶段 的 指令 是 否 要 写 HI. LO Frl 


i 


ts 
N 


输入 处 于 访 存 阶 段 和 的 指令 要 写 入 HI 寄存 器 的 值 
mem lo i 3 ) 处 于 访 存 阶段 的 指令 要 写 入 LO BÄREN 


mem hi i 


tad 
> 


wW jw fue Ir 
hn > las 


wb_whilo i 处 于 回 写 阶段 的 指令 是 否 要 写 HL. LO EA 
wb hi i 2 处 于 回 写 阶段 的 指令 要 写 入 HI 寄存 器 的 值 
wh lo i 3 处 于 回 写 阶段 的 指令 要 写 入 LO 寄存 器 的 值 


接口 名 


的 指令 是 否 要 写 HI、LO Pfr 
多 的 指令 要 写 入 HI 寄存 器 的 值 
LS BES A LO 寄存 器 的 值 
cp0_reg data i 32 输 2 从 CPO 横 块 读 取 的 指定 寄存 器 的 值 


mem cp0 reg we 输 访 存 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 
oe 5 入 沪 存 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 数据 
[e [hoes [i [ua A 
Æ p 


wb _cp0 reg write addr 4f 7 写 阶段 的 指令 要 写 的 CP0 中 寄存 器 的 地 址 


的 指令 要 写 入 CP0 中 寄存 器 的 数 


执行 阶段 的 指令 要 读 取 的 CPO 中 寄存 器 也 


cp0_reg read addr o 地 二 
131 


cp0_reg we_o 输 执行 阶段 的 指令 是 否 要 写 CRO 中 的 寄存 器 


cp0 reg write addr o 输出 执行 阶段 的 指令 要 写 的 CPO 中 寄存 器 的 地 寺 
cp0_reg data o 32 输 ! 执行 阶段 的 指令 要 写 入 CP0 中 寄存 器 的 数据 
inst i 输 2 当前 处 于 执行 阶段 的 指令 
aluop_o 输 执行 阶段 的 指令 要 进行 的 运算 的 子 类 型 
mem addr o z di mA KERNE ch 

存储 指令 要 存储 的 数据 , 或 者 Iwl、 Iwr 指令 
要 写 入 的 目的 寄存 器 的 原始 什 

执行 阶段 是 否 请 求 流水 线 和 暂停 


A.7 DIV 模 块 接 口 说 明 


DIV 模块 接口 如 图 A-7 所 示 ， 各 接口 的 描述 如 表 A-7 所 示 。 


DIV 


annul 1 
signed div i result_o 
opdatal i ready_o 


opdata2_i 


start 1 


rst 


clk 


div,v 
图 A-7 ”DIV 模块 的 外 部 接口 


表 A-7 ”DIV 模块 的 接口 描述 


fe 号 | 接口 名 | 宽度 (bit | 输入 输出 作用 


= 
Z 
a 


le 
ae | 
a [emn 1: 


w 


中 


opdata2 i 


复位 信号 ， 高 电 平 有 效 
时 钟 信号 

是 否 是 有 符号 除法 ， 为 1 表示 有 符号 除法 
被 除数 

除数 


start 1 


ua [aju 


annul i 


a fems | 


9 ready_o 


mH 


MH 


是 否 开 始 除 法 运 入 
EF 运算 ， 为 1 表示 取消 除法 运算 
rr 


除法 运算 是 否 结束 


A.8 EX/MEM 模 块 接口 说 明 


EX/MEM 模 块 接口 如 图 A-8 所 示 ， 各 接口 的 描述 如 表 A-8 所 示 。 


EX/MEM 


stall 

flush 

ex_cp0_ reg we 
ex_cp() reg write_addr 
ex _cp0_reg data 


ex_mem_addr 


ex reg? 

ex_hi 

ex_lo 

ex_whilo 

hilo_i 

ent i 
ex_excepttype 

ex is in delayslot 
ex_current_inst_address 
ex_aluop 

ex_wreg 

ex_wd 

ex_wdata 


rst 


clk 


mem_wd 
mem_wreg 
mem_wdata 
mem_hi 
mem_lo 
mem_whilo 
mem_aluop 


mem_mem_addr 


mem_reg? 
mem cpû reg we 
mem_cp0_reg_write_addr 
mem_cp0_reg_data 
mem_excepttype 
mem_is in delayslot 

mem _current_inst_address 
hilo_o 


cnt_o 


ex_mem.v 


图 A-8 EX/MEM 模 块 的 外 部 接口 


表 A-8 ”EX/MEM 模 块 的 接口 描述 


一 一 一 一 一 一 一 一 
(bit) | 输出 

| [| a 
CE a 
Wie TIC EA OA 
Cee 0 | 执行 阶段 的 指令 执行 后 是 耕 有 要 写 入 的 目的 寄存 器 
s o [ewan [32 | 输入 | 执行 阶段 的 指令 执行 后 要 写 入 目的 寄存 器 的 值 
e [memwa |5 | 输出 | 访 在 阶段 的 指令 要 写 入 的 目的 寄 在 器 地 记 
7 | memwree j Pam | 访 存 阶 段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 
CE 输出 访 在 阶段 的 指令 要 写 入 日 的 寄存 器 的 值 
w [anf CT ie RR 
u fexcporegwe Ja | 输入 执行 阶段 的 指令 是 否 要 写 CP0 中 的 寄存 器 
|12 [ex cpO reg write addr |s | 输入 | 执行 阶段 的 指令 要 写 的 CPO 中 寄存 器 的 地 志 
热 行 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 数据 
114 |memeporegwe |i Jan | 访 在 阶段 的 指令 是 否 要 写 CP0 中 的 寄存 器 
访 存 阶段 的 指令 要 写 的 CPO 中 寄存 融 的 地 址 
116  [memcp0reg daa |32 [iam | 访 存 阶段 的 指令 要 写 入 CP0 中 寄存 器 的 数据 
CA fexatuop |[s Jr | 执行 阶段 的 指令 要 进行 的 运算 的 于 类 型 
EE — m 执行 阶段 的 加 载 ， 存 储 指令 对 应 的 存储 器 地 志 


4) 执行 阶段 的 存储 指令 要 存储 的 数据 , 或 者 1wl、 hwr 
ex regs iA NS ape 

a J OBES AI P NIAE TE RS I AL 

lao | 


mem | mem aluop | ETT 访 存 阶段 的 指令 要 进行 的 运算 的 子 类 型 


o uma la ml teo a 


A e lwh Iwr 

eae ee TONY ERS ENTE ECHT 

ex ENT la mr | 执行 阶段 的 指令 是 再 要 写 HI, LO 寄存 器 
en 执行 阶段 的 指令 要 写 入 HI 寄存 器 的 什 
执行 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
fe ee i | 访 存 阶段 的 指令 是 否 要 写 HI, LO 寄存 器 
输出 访 存 阶 段 的 指令 要 写 入 HI 寄存 器 的 值 
访 存 阶段 的 指令 要 写 入 LO ii fe ae NAL 
29 fexcexceptype [32 | 输入 | mm. 执行 阶段 收集 到 的 异常 信息 

ex_current_inst_address 2 | MRA | DAT ERAS fry hl 
a feas CTS Meee ees 
输出 “| 详 码 、 执 行 阶段 收集 到 的 异常 信息 


接口 名 ie 作 用 


mem current inst address 访 存 阶段 指令 的 地 址 


| re ETERA 
ESTA COS none 


一 个 时 钟 周期 是 执行 阶段 的 第 儿 个 时 钟 周期 
a 
当前 处 于 执行 阶段 的 第 儿 个 时 钟 周期 


A.9 MEM 模 块 接 口 说 明 


MEM 模 块 接口 如 图 A-9 所 示 ， 各 接口 的 描述 如 表 A-9 所 示 。 


wd_i 
wreg_i 


wdata_i 


lo_i 
whilo_i 
aluop_i 


mem_addr_i 


reg2 i 

cp0_reg we 1 
cp0O_reg_write_addr_i 
cp0_reg data 1i 
excepttype_i 
is_in_delayslot_i 
current_inst_address_i 
LLbit_i 

cpO_status_i 
cp0_cause_i 
cp0_epc_i 
wb_LLbit_we_i 
wb_LLbit_value_i 
wb_cp0_reg_we 
wb_cp0_reg_write_addr 
wb_cp0O_reg_ data 
mem_data_i 


rst 


MEM 


cp0_epc_o 

LL bit_value_o 
LLbit_we_o 
wd_o 

wreg_o 
wdata_o 

hi_o 

lo_o 

whilo_o 
cp0_reg_we_o 
cpO_reg_write_addr_o 


cpO_reg_data_o 


excepttype_o 


current_inst_address_o 


is_in_delayslot_o 


mem_we_o 
mem_addr_o 
mem_sel_o 


mem_data_o 


mem_ce_o 


mem.v 


图 A-9 MEM 模 块 的 外 部 接口 


表 A-9 MEM 模 块 的 接口 描述 


E 
Jo 


2 


wd i 
wreg i 
wdata_1 
wd_o 
wreg 0 
wdata_o 


aluop i 


mem data i 


ww 
2 


mem addr © 


+ 


mem We o 


D 


mem_sel_o 


3 
2 


mem _data_o 


tu 


mem ce o 


whilo i 


kar) 


whilo_o 


oo | 
2 
soo 
mo | 
s | 
is | 
19 

20 | 


e E 
a 


2 

E. 
o 
2 


cp0_ reg We i 


mn 


wo fe D 
jn 


cp0_reg write addr i 


ta 
3 


cp reg data_i 
cp0 reg we_o 


cp0 reg write addr o 


ae 
N 


ep0 _ reg data_o 


excepttype i 


2 


w w t » N to w nm nm 
z » wo “< Nn 4 = |» 


current inst address i 
is in delayslot 1 


cp0 status i 


| ji 


2 


ep0 cause i 32 


nm [1 | 


t Le w ta) wv w a 六 
m N N » > 
> 


FA 
输入 


输入 
输入 


访 存 阶 段 的 指令 要 写 入 的 绅 的 寄存 器 地 址 

访 存 阶 段 的 指令 是 否 有 要 写 入 的 目的 寄存 器 

访 存 阶 段 的 指令 要 写 入 上 日 的 寄存 器 的 什 

访 在 阶段 的 指令 最 终 要 写 入 的 目的 寄存 器 地 址 

访 存 哈 段 的 指令 最 终 是 否 有 要 写 入 的 目的 寄存 器 
访 存 阶段 的 指令 最 终 要 写 入 目的 寄存 器 的 值 

访 存 阶 段 的 指令 要 进行 的 运算 的 子 类 型 

访 存 阶段 的 加 载 、 和 存储 指令 对 应 的 存储 器 地 址 
访 存 阶段 的 存储 指令 要 存储 的 数据 ,或 者 hvl, wr 


i 令 要 写 入 的 目的 寄存 器 的 原 妈 值 


从 数据 存储 器 恋 开 的 数据 
要 访问 的 数据 存储 器 的 地 址 


是 否 是 写 操作 ， 为 1 表示 是 写 操作 


访 存 阶段 的 指令 是 否 要 写 HI, LO 寄存 器 

访 存 阶 段 的 指令 要 写 入 HI 寄存 并 的 值 

访 存 阶段 的 指令 要 写 入 LO 寄存 器 的 值 

访 存 阶段 的 指令 最 终 是 否 要 写 HI. LO AH 
访 存 阶段 的 指令 最 终 要 写 入 HI 寄存 器 的 值 

访 在 阶段 的 指令 最 终 要 写 入 LO 寄存 器 的 值 

访 存 阶段 的 指令 是 于 要 写 CPO 中 的 寄存 器 

TER EIIE BES IN) CPO 中 寄存 器 的 地 址 

访 存 阶段 的 指令 要 写 入 CPO 中 寄存 器 的 数据 

访 存 阶 段 的 指令 最 终 是 否 归 写 CPO 中 的 寄存 器 

访 存 阶段 的 指令 最 终 要 写 的 CP0 中 寄存 器 的 地 直 
访 存 阶 段 的 指令 最 终 要 写 入 CPO 中 寄存 器 的 数据 
译 码 、 执 行 阶 段 政 集 到 的 异常 信息 

访 存 阶段 指令 的 地 直 

ERT PLATO JETT AE EE WE > 

CPO 中 Status 窗 在 器 的 值 

CPO 中 Cause 寄存 器 的 值 


续 表 


= 宽度 | 输入 / 


CPO 中 EPC 寄存 器 的 值 

回 写 阶段 的 指令 是 和 否 要 写 CPO 中 的 寄存 器 
回 写 阶段 的 指令 要 写 的 CRO 中 寄存 器 的 地 址 
回 写 阶段 的 指令 要 写 入 CRO 中 寄存 器 的 值 
最 终 的 异常 类 型 

访 存 阶 段 指令 的 地 址 


39 current_inst_address_o 32 
40 is in delayslot_o 1 
41 cp0 enc o 32 


输 
输出 


输出 


访 存 阶段 的 指令 是 否 是 延迟 档 指 令 


CPO 中 EPC 寄存 器 的 最 新 值 


43 wb LLbit we i 输入 回 写 阶段 的 指令 是 否 要 写 LLbit 寄存 器 
44 wb LLbit value i 输入 回 写 阶段 要 写 入 LLbit 寄存 器 的 值 


45 LLbit we o 1 输出 访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 
46 LLbit value o 1 输出 访 存 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 
J 1 A 
A.10 MEM/WB Y 


MEM/WB 模 块 接口 如 图 A-10 所 示 ， 各 接口 的 描述 如 表 A-10 所 示 。 


MEM/WB 


stall wb_whilo 
flush wb_hi 
mem_LLbit_value wb lo 
mem_LLbit_we wb_LLbit_we 
mem wd wb_LLbit_value 
mem_wreg 

mem_wdata wb_wd 
mem hi wb_wreg 
mem_lo wb_wdata 
mem_whilo wb_cp0_reg we 
mem_cp0_reg we wb_cp0_reg_write_addr 
mem cp0 reg write addr wb_cp0_reg data 


mem cp0 reg data 


rst 


clk 


mem_wb.v 


图 A-10 MEM/WB 模 块 的 外 部 接口 


表 A-10 ”MME/WB 模 块 的 接口 描述 


a 
(bit) 
CI 


mem_wd 
as 


wb_LLbit_we 


访 存 阶 段 的 指令 最 终 要 写 入 的 目的 寄存 器 
地 址 


访 在 阶段 的 指令 最 终 是 否 有 要 写 入 的 目的 寄 


(54 


输入 


输入 访 存 阶段 的 指令 最 终 要 写 入 目的 寄 在 器 的 值 
的 指令 要 写 入 的 目的 寄存 器 地 址 


=> 


输 
输出 写 阶 段 的 指令 是 杏 有 要 写 入 的 目的 寄存 器 
输出 写 阶 段 的 指令 要 写 入 目的 寄存 器 的 值 
输入 访 存 阶段 的 指令 是 否 要 写 LLbit 寄存 器 

输 访 存 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 
输出 回 写 阶段 的 指令 是 埋 要 写 LLbit 寄存 器 


输出 回 写 阶段 的 指令 要 写 入 LLbit 寄存 器 的 值 


wb_LLbit_ value 


输入 访 存 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 
访 存 阶段 的 指令 要 写 的 CP0 中 寄存 器 的 地 赴 


访 存 阶 段 的 指令 要 写 入 CP0 中 寄存 器 的 数据 


mem cp0 reg we 


mem cp0 reg write_addr 


mem cp0 reg data 


2 


w in w 
» t 
> | = SS |S |S 


wb cp0 reg we 回 写 阶段 的 指令 是 否 要 写 CPO 中 的 寄存 器 


wb_cp0_reg write addr HE BST DE CPO P ay (Fae SLA 


wb_cp0 reg data 


mem_whilo 


回 写 阶段 的 指令 要 写 入 CP0 中 寄存 器 的 3 
TFT BUTT HEAP EG HI, LO 寄存 器 
访 存 阶 段 的 指令 要 写 入 HI Ar fF 5 YEE 


mem lo 32 i 7 访 存 阶 段 的 指令 要 写 入 LO 寄存 器 的 值 


wb_whilo 辣 写 阶段 的 指令 是 否 要 写 HL, LO 寄存 器 


回 写 阶段 的 指令 要 写 入 HI 寄存 器 的 值 


辐 写 阶段 的 指令 要 写 入 LO 寄存 器 的 值 
Ui FF BE HE AT eT 


是 否 清除 流水 线 


A.11 CP0 模 块 接口 说 明 


CP0 模 块 接口 如 图 A-11 所 示 ， 各 接口 的 描述 如 表 A-11 所 示 。 


CP0 


we_i data_o 
waddr 1 count_o 
data i compare_o 
excepttype_i status 0 
int 1 Cause 0 
current inst addr i epc_o 
is in delayslot i config_o 
raddr i prid_o 
rst 

clk timer_int_o 


cp0_reg.v 
图 A-11 CP0 模 块 的 外 部 接口 


表 A-11 CP0 模 块 的 接口 描述 


输入 / 
一 一 一 一 一 一 


fe Te fm 


raddr i 要 读 取 的 CPO 中 寄存 器 的 地 址 


int i 1) 6 个 外 部 硬件 中 断 输 入 


we i Ai 是 否 要 写 CPO 中 的 寄存 器 


count o i Count 寄存 器 的 值 


cause 0 输 ! Cause 寄存 器 的 值 


epc_o E 输 ! EPC 寄存 右 的 值 


config o 输 Config 寄存 器 的 值 


PRId 寄存 器 的 值 


是 否 有 定时 中 断 发 生 


发 生 异 常 的 指令 地 址 


= iE fa delyet ó IE BEE SEHE > He FR HE EI 


A.12 ”LLbit 模 块 接口 说 阴 


LLbit 模 块 接口 如 图 A-12 所 示 ， 各 接口 的 描述 如 表 A-12 所 示 。 


LLbit 
we 
LLbit i LLbit_o 
flush 


rst 


clk 


LLbit_reg.v 


图 A-12 ”LLbit 模 块 的 外 部 接口 


表 A-12 ”LLbit 模 块 的 接口 描述 


A.13 HILO 模块 接口 说 明 


HILO 模 块 接口 如 图 A-13 所 示 ， 各 接口 的 描述 如 表 A-13 所 示 。 


HILO 


hilo_reg.v 


图 A-13 ”HILO 模块 的 外 部 接口 
表 A-13 HILO 模块 的 接口 描述 


je 号 | 接口 名 | we on | mams 作 


1 TSt 1 i 
2 clk 1 N 


BEGA HI 寄存 器 的 值 
要 写 入 LO 寄存 器 的 值 
HI 霖 存 器 的 值 


A.14 CTRL 模块 接口 说 阴 


CTRL 模 块 接口 如 图 A-14 所 示 ， 各 接口 的 描述 如 表 A-14 所 示 。 


CTRL 
excepttype_1 new_pc 
cp0_epc 1 stall 
stallreq_from_ex flush 


stallreq from id 


rst 


Ctrl. y 
图 A-14 CTRL 模块 的 外 部 接口 


表 A-14 ” CTRL 模块 的 接口 描述 


接口 名 FEED | 输入 /输出 
1 输入 复位 信号 


E stallreq_from id ı EZ SbF FEAT BL HS ERA AA 
stallreq_from_ex 处 于 执行 阶段 的 指令 是 否 请 求 流水 线 暂 


输出 暂停 流水 线 控制 信号 


‘iy EL 异常 处 理 入 口 地 址 


mil 是 否 清除 流水 线 


附录 B OpenMIPS 实现 的 所 有 指 
令 及 对 应 的 机 器 码 


B.1 逻辑 操作 指令 


31 26 25 21 20 16 15 11 10 6 5 0 

ae ds jt ed 00000 a and rd, rs, rt 

maso J e e om | ah ess 
End is it immediate andi rt, rs, immediate 
nn m rt immediate xori rt, rs, immediate 
cont | 00000 rt immediate lui rt, immediate 
man rs rt immediate ori rs, rt, immediate 


B2 移 位 操作 指令 


31 26 25 21 20 16 15 11 10 
Er 00000 r rd sa Nra 
”000000 | 00000 rt rd sa Bere 
a s 00000 rt rd sa Be 1 
ee ts rt rd 00000 Rae 
aman o | y 
pa : rs rt rd 00000 > eo 
= G 

B3 ”移动 操作 指令 
31 26 25 21 20 16 15 11 10 
ye E rt él 00000 en 
man o | «| a | om | yom 
”00o000 | 00000 | 00000 rd 00000 O 
sooo | 00000 | 00000 rd 00000 a 
ql as 00000 | 0000 | 00000 pee 
aig rs 00000 | 00000 | 00000 Naas 


BA ”算术 操作 指令 


sll rd, rt, sa 


srl rd, rt, sa 


sra rd, rt, sa 


sllv rd, rt, rs 


srlv rd, rt, rs 


srav rd, rt, rs 


movn rd, ts, rt 


movz rd, rs, rt 


mfhi rd 


mflo rd 


mthi rs 


mtlo rs 


31 26 


SPECIAL 


21 20 


16 15 


11 10 


ADD 


000000 a 100000 
SPECIAL a ADDU 
000000 100001 
SPECIAL a SUB 
000000 100010 
SPECIAL SUBU 
000000 = 100011 
SPECIAL F SLT 
000000 i 101010 
SPECIAL m SLTU 
000000 101011 
SPECIAL F MULT 
000000 011000 
SPECIAL = MULTU 
000000 011001 
SPECIAL $ DIV 
000000 011010 
SPECIAL = DIVU 
000000 011011 
SPECIAL2 MADD 
011100 3 000000 
SPECIAL2 z MADDU 
011100 000001 
SPECIAL2 5 MSUB 
011100 000100 
SPECIAL2 x MSUBU 
011100 000101 
SPECIAL2 P CLZ 
011100 100000 
SPECIAL2 3 CLO 
011100 100001 
SPECIAL2 $ MUL 
011100 000010 
ADDI ts immediate 
001000 
ADDIU A inmediate 
001001 immediate 
SL rs immediate 
001010 
SLTIU a 、 
ts immediate 


001011 


add rd, rs, rt 


addu rd, rs, rt 


sub rd, ts, rt 


subu rd, rs, rt 


slt rd, rs, rt 


situ rd, rs, rt 


mult rs, st 


multu rs, st 


div rs, rt 


divu rs, rt 


madd rs, rt 


maddu rs, rt 


msub rs, rt 


msubu rs, rt 


clz rd, rs 


clo rd, t's 


mul rd, rs, st 


addi rt, rs, immediate 


addiu rt, rs, immediate 


slti rt, rs, immediate 


sitiu rt, rs, immediate 


B.5 转移 指令 


31 26 25 20 16 15 11 10 6 3 
SPECIAL pS 
000000 rs | 00000 | 00000 | 00000 regt 
SPECIAL Pre 
000000 TS 00000 rd 00000 nn 
J vr 
000010 instr_index 
JAL u 
000011 instr_index 
BEQ 
000100 ts rt offset 
BEQ 
000100 | 00000 00000 offset 
BGTZ 
000111 rs 00000 offset 
BLEZ 
000110 ES 00000 offset 
BNE 
000101 ES rt offset 
REGIMM BLTZ 
000001 A 00000 offset 
REGIMM a BLTZAL re 
000001 10000 
REGIMM BGEZ 
000001 rs 00001 offset 
REGIMM BGEZAL 
000001 i 10001 offset 
Pe 00000 eat offset 


B.6 “加载 存储 指令 


jrrs 

jalr rs 或 jalr rd, rs 
j target 

jal target 

beq rs, rt, offset 
b offset 

bgtz rs, offset 
blez rs, offset 
bne rs, rt, offset 
bltz rs, offset 
bitzal rs, offset 
bgez rs, offset 
bgezal rs, offset 


bal offset 


lb rt, offset(base) 


Ibu rt, offset(base) 


lh rt, offset(base) 


Ihu rt, offset(base) 


lw rt, offset(base) 


sb rt, offset(base) 


sh rt, offset(base) 


sw rt, offset(base) 


Iwl rt, offset(base) 


Iwr rt, offset(base) 


swl rt, offset(base) 


swr rt, offset(base) 


Il rt, offset(base) 


31 26 25 21 20 16 15 
1 cs 0 base rt offset 
| A base rt offset 
| iain hase rt offset 
| med base rt offset 
| ed i hase rt offset 
ER hase rt offset 
| an base rt offset 
a i base rt offset 
a base rt offset 
I base rt offset 
| on 0 hase rt offset 
Ks base rt offset 
| 0 base rt offset 
1 de 0 base rt offset 


sc rt, offset(base) 


B.7 协 处 理 器 访问 指令 


31 26 25 21 20 16 15 11 10 32 0 
Ppt ne rd 00000000 sel | mtcO rt, rd 
OS nn rd 00000000 sel | mfcO rt, rd 


B.8 ” 异 弟 相关 指令 


nop 


ssnop 


syne 


pref 


31 26 25 21 20 16 15 6 
SPECIAL TEQ 
000000 E y sode 110100 | “east 
SPECIAL TGE 
000000 ES n cde 110000 | ‘ge rs Tt 
SPECIAL TGEU 
000000 “ code 110001 | tgeurs,rt 
SPECIAL TLT 
000000 rs rt code 110010 tlt rs, rt 
SPECIAL TLTU 
000000 rs rt code 110011 tltu rs, rt 
SPECIAL TNE 
000000 ES rt code 110110 tne rs, rt 
REGIMM TEQI A 
000001 TS 01100 immediate teqi rs, immediate 
REGIMM TGEI A A y F N 
000001 rs 01000 immediate tgei rs, immediate 
REGIMM rs TGEIU immediat tgeiu rs, immediate 
000001 01001 aS 8 
REGIMM TLTI E > 
000001 rs 01010 immediate tlti rs, immediate 
REGIMM TLTIU id RN 
000001 rs 01011 immediate tltiu rs, immediate 
RAMY rs TNEI i diat tnei rs, immediate 
000001 01110 ió i 
SPECIAL d SYSCALL svaca 
000000 COSp 001100 4 
COP0 |CO ERET | __ 
010000 1 0000 0000 0000 0000 000 011000 eret 
BI ” 空 指 令 及 其 他 指令 
31 26 25 21 20 16 15 11 10 6 5 
SPECIAL SLL 
000000 00000 00000 00000 00000 000000 
SPECIAL SLL 
000000 00000 00000 00000 00001 000000 
SPECIAL SYNC 
000000 00000 00000 00000 00001 001111 
ay 1 base hint offset 
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